[sword-devel] Module release: FreCrampon

DM Smith dmsmith at crosswire.org
Wed Mar 19 07:57:15 EDT 2025


Arnaud,

Always best for fixes to be done upstream. I’d suggest that if you do have fixes in your Bible Scraper that you also catalog them so that the catalog can be given to the upstream maintainers.

DM

> On Mar 19, 2025, at 4:55 AM, Arnaud Vié <unas.zole+avie at gmail.com> wrote:
> 
> Hi David,
> 
> These bibles are generated by Cyrille using my Bible Scraper tool.
> 
> At Cyrille's request, I implemented in this tool a small functionality to fix fix typography on the fly to conform to the usual French rules. If I remember well, I followed the rules on this page : https://formations.mywebisrich.eu/index.php?post/2019/10/06/Pense-bete-les-espaces-autour-des-signes-de-ponctuation-grammaticaux-et-mathematiques
> 
> In particular, the use of NBSP and NNBSP before/after punctuation marks is on purpose, as highlighted by your Grok conversation : it avoid disjointing the punctuation mark from the previous/next word. (When to use NBSP versus NNBSP is a bit arbitrary apparently - the page I followed recommended a full width NBSP for guillemets and colon, while your Grok conversation suggests NNBSP there as well).
> 
> I could probably add a rule to replace apostrophes stuck between two letters (probably the best way to detect the elision use case) with U+2019 as well - though Cyrille may prefer fixing those in the wikisource text directly since you're giving an explicit list.
> 
> Regards,
> 
> Arnaud
> 
> Le mer. 19 mars 2025 à 09:37, David Haslam <dfhdfh at protonmail.com <mailto:dfhdfh at protonmail.com>> a écrit :
>> Here are the 19 verse locations for those 24 ordinary apostrophes that ought to replaced by U+2019.
>> 
>> Numbers 4:22: « Compte aussi les fils de Gerson d'après leurs maisons patriarcales, d’après leurs familles ;
>> Numbers 10:26: la troupe de la tribu des fils d’Aser était commandée par Phégiel, fils d'Ochran,
>> Numbers 12:8: Je lui parle bouche à bouche, en me faisant voir, et non par énigmes, et il contemple la figure de Yahweh. Pourquoi donc n'avez-vous pas craint de parler contre mon serviteur, contre Moïse ? »
>> Numbers 12:12: Ah ! Qu'elle ne soit pas comme l’enfant mort-né qui, en sortant du sein de sa mère, a la chair à demi-consumée ! »
>> Numbers 12:14: Yahweh dit à Moïse : « Si son père lui avait craché au visage, ne serait-elle pas pendant sept jours couverte de honte ? Qu'elle soit séquestrée sept jours hors du camp ; après quoi, elle y sera reçue. »
>> Numbers 13:20: ce qu’est le sol, s’il est gras ou maigre, s’il y a des arbres ou non. Ayez bon courage, et prenez des fruits du pays. » C'était le temps des premiers raisins.
>> Numbers 20:19: Les enfants d’Israël lui dirent : « Nous monterons par la grande route, et, si nous buvons de ton eau, moi et mes troupeaux, j'en paierai le prix. Ce n'est pas une affaire ; je ne ferai que passer avec mes pieds. »
>> Numbers 22:3: et Moab fut très effrayé en face du peuple, car celui-ci était nombreux ; il fut saisi d'épouvante en face des enfants d’Israël.
>> Numbers 31:18: mais toutes les filles qui n'ont pas connu la couche d’un homme, laissez-les vivre pour vous.
>> Numbers 31:35: et trente-deux mille d’entre les femmes qui n'avaient pas connu la couche d’un homme.
>> Numbers 32:23: Mais si vous n'agissez pas ainsi, voici, vous péchez contre Yahweh ; et sachez que votre péché vous atteindra.
>> Numbers 32:33: Moïse donna aux fils de Gad et aux fils de Ruben, et à la moitié de la tribu de Manassé, fils de Joseph, le royaume de Séhon, roi des Amorrhéens, et le royaume d'Og, roi de Basan, le pays avec ses villes et leurs territoires, les villes du pays d'alentour.
>> Numbers 32:40: Moïse donna Galaad à Machir, fils de Manassé, qui s'y établit.
>> Numbers 33:2: Moïse mit par écrit les lieux d'où ils partirent, selon leurs campements, d'après l’ordre de Yahweh, et voici leurs campements selon leurs départs :
>> Numbers 33:14: Ils partirent d’Alus et campèrent à Raphidim, et il n'y eut pas là d’eau à boire pour le peuple.
>> Numbers 35:12: Ces villes vous serviront de refuge contre le vengeur du sang, afin que le meurtrier ne soit pas mis à mort avant d'avoir comparu en jugement devant l’assemblée.
>> II Maccabees 15:32: et il leur montra la tête du criminel Nicanor et la main que ce blasphémateur avait étendue avec tant d'insolence contre la demeure sainte du Tout-Puissant.
>> II Maccabees 15:33: Puis, ayant coupé la langue de l'impie Nicanor, il voulut qu'on la donnât par morceaux en pâture aux oiseaux, et qu'on suspendit en face du temple le prix remporté par sa folie.
>> Jonah 2:8: Quand mon âme défaillait en moi,
>> je me suis souvenu de Yahweh ;
>> et ma prière est parvenue jusqu'à vous,
>> à votre saint temple.
>> 
>> Interesting that a majority of these are found in the same book!
>> 
>> Best regards,
>> 
>> David
>> 
>> Sent with Proton Mail <https://pr.tn/ref/SWXT9A5YZ67G> secure email.
>> 
>> On Wednesday, March 19th, 2025 at 8:00 AM, David Haslam <dfhdfh at protonmail.com <mailto:dfhdfh at protonmail.com>> wrote:
>>> A Word Frequency analysis on the FreCrampon text has uncovered 21 instances of words where the ordinary ASCII apostrophe was used to mark elision, instead of the proper character U+2019 RIGHT SINGLE QUOTATION MARK used in all the other places.
>>> 
>>> Word Count
>>> C'était 1
>>> Qu'elle 2
>>> d'Ochran 1
>>> d'Og 1
>>> d'alentour 1
>>> d'après 2
>>> d'avoir 1
>>> d'insolence 1
>>> d'où 1
>>> d'épouvante 1
>>> j'en 1
>>> jusqu'à 1
>>> l'impie 1
>>> n'agissez 1
>>> n'avaient 1
>>> n'avez-vous 1
>>> n'est 1
>>> n'ont 1
>>> n'y 1
>>> qu'on 2
>>> s'y 1
>>> 
>>> 
>>> These should each be changed to use U+2019.
>>> 
>>> The issue should be fixed upstream in https://fr.wikisource.org/wiki/Bible_Crampon_1923
>>> 
>>> FIO. The attached 7-Zip file contains the Word Frequency analysis.
>>> NB. References were first stripped out, and both types of NBSP were replaced by an ordinary space.
>>> 
>>> Best regards,
>>> 
>>> David
>>> 
>>> Sent with Proton Mail <https://pr.tn/ref/SWXT9A5YZ67G> secure email.
>>> 
>>> On Tuesday, March 18th, 2025 at 10:02 PM, David Haslam <dfhdfh at protonmail.com <mailto:dfhdfh at protonmail.com>> wrote:
>>>> But see the continuation of my AI chat exchange in https://grok.com/share/bGVnYWN5_0023c289-2171-4f8b-8ad7-98e0f086eeb8
>>>> 
>>>> It may still be preferable to use U+202F NARROW NO-BREAK SPACE [NNBSP] to separate the Guillemots from the word at start and end of each quotation.
>>>> 
>>>> cf. This is already the case in French module FreLXXGiguet.
>>>> 
>>>> If we go down that route consistently, then some preprocessing would be required before performing a Word Frequency analysis on the module's text content.
>>>> i.e. As part of module testing, in order to uncover any further anomalies.
>>>> 
>>>> Best regards,
>>>> 
>>>> David
>>>> 
>>>> Sent with Proton Mail <https://pr.tn/ref/SWXT9A5YZ67G> secure email.
>>>> 
>>>> On Tuesday, March 18th, 2025 at 9:42 PM, David Haslam <dfhdfh at protonmail.com <mailto:dfhdfh at protonmail.com>> wrote:
>>>>> I hadn't thought of doing this analysis until today.
>>>>> 
>>>>> My recent detailed observations about the FreBBB module also are applicable to FreCampon.
>>>>> 
>>>>> FreCrampon contains 22143 U+00A0 NO BREAK SPACE (NBSP)
>>>>> 
>>>>> Of these, 6152 are not followed immediately by a punctuation mark!
>>>>> All but one of those are followed by a word character.
>>>>> 
>>>>> This means that 15991 of the NBSP are followed by a punctuation mark.
>>>>> 
>>>>> All 6151 of the othe locations match the PCRE [[:punct:]]\xA0\w+
>>>>> 
>>>>> i.e. These are each preceded by a punctuation mark.
>>>>> 
>>>>> I therefore recommend that each NBSP be replaced by U+2008 PUNCTUATION SPACE
>>>>> 
>>>>> The 1 exception out of the 6152 is where the NBSP occurs strangely at the end of a verse!
>>>>> 
>>>>> Mark 2:22: Et personne ne met du vin nouveau dans des outres vieilles : autrement, le vin fait rompre les outres et le vin se répand, et les outres sont perdues. Mais le vin nouveau doit se mettre dans des outres neuves. «    
>>>>> 
>>>>> i.e. It's the invisible character after an ordinary space after the «
>>>>> That « may well be a typo, as it should surely be a » 
>>>>> 
>>>>> To sum up: Replace all U+00A0 by U+2008 and correct the above typo!
>>>>> 
>>>>> We should advise the upstream source to do likewise!
>>>>> 
>>>>> Best regards,
>>>>> 
>>>>> David
>>>>> 
>>>>> Sent with Proton Mail <https://pr.tn/ref/SWXT9A5YZ67G> secure email.
>>>>> 
>>>>> 
>>>>> On Monday, March 10th, 2025 at 9:51 AM, domcox at crosswire.org <mailto:domcox at crosswire.org> domcox at crosswire.org <mailto:domcox at crosswire.org> wrote:
>>>>> 
>>>>> 
>>>>> Dear All,
>>>>> 
>>>>> This is to announce that we have just now uploaded FreCrampon
>>>>> in the CrossWire (main) repository.
>>>>> 
>>>>> ## Language:
>>>>> French
>>>>> 
>>>>> ## Description:
>>>>> La Bible Augustin Crampon 1923
>>>>> 
>>>>> ## Category:
>>>>> Biblical Text
>>>>> 
>>>>> ## Version:
>>>>> This is an update. Version: 3.2
>>>>> 
>>>>> ## What's new:
>>>>> Complete rereading of the whole Bible, correction of NT cross-references.
>>>>> 
>>>>> Many thanks to Cyrille_LAfricain for the hard work.
>>>>> 
>>>>> We wish you enjoyable reading,
>>>>> The Module Team
>>>>> 
>>>>> P.S.: This email is sent automatically on upload of a new/updated module
>>>>> 
>>>>> _______________________________________________
>>>>> sword-devel mailing list: sword-devel at crosswire.org <mailto:sword-devel at crosswire.org>
>>>>> http://crosswire.org/mailman/listinfo/sword-devel
>>>>> Instructions to unsubscribe/change your settings at above page
>>>>> 
>>>> 
>>> 
>> 
>> _______________________________________________
>> sword-devel mailing list: sword-devel at crosswire.org <mailto:sword-devel at crosswire.org>
>> http://crosswire.org/mailman/listinfo/sword-devel
>> Instructions to unsubscribe/change your settings at above page
> _______________________________________________
> sword-devel mailing list: sword-devel at crosswire.org
> http://crosswire.org/mailman/listinfo/sword-devel
> Instructions to unsubscribe/change your settings at above page

-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://crosswire.org/pipermail/sword-devel/attachments/20250319/3f3f76c4/attachment-0001.htm>


More information about the sword-devel mailing list