[sword-devel] Module release: FreCrampon

Arnaud Vié unas.zole+avie at gmail.com
Wed Mar 19 04:55:40 EDT 2025


Hi David,

These bibles are generated by Cyrille using my Bible Scraper tool.

At Cyrille's request, I implemented in this tool a small functionality to
fix fix typography on the fly to conform to the usual French rules. If I
remember well, I followed the rules on this page :
https://formations.mywebisrich.eu/index.php?post/2019/10/06/Pense-bete-les-espaces-autour-des-signes-de-ponctuation-grammaticaux-et-mathematiques

In particular, the use of NBSP and NNBSP before/after punctuation marks is
on purpose, as highlighted by your Grok conversation : it avoid disjointing
the punctuation mark from the previous/next word. (When to use NBSP versus
NNBSP is a bit arbitrary apparently - the page I followed recommended a
full width NBSP for guillemets and colon, while your Grok conversation
suggests NNBSP there as well).

I could probably add a rule to replace apostrophes stuck between two
letters (probably the best way to detect the elision use case) with U+2019
as well - though Cyrille may prefer fixing those in the wikisource text
directly since you're giving an explicit list.
Regards,

Arnaud

Le mer. 19 mars 2025 à 09:37, David Haslam <dfhdfh at protonmail.com> a écrit :

> Here are the 19 verse locations for those 24 ordinary apostrophes that
> ought to replaced by U+2019.
>
> *Numbers 4:22*: « Compte aussi les fils de Gerson d'après leurs maisons
> patriarcales, d’après leurs familles ;
> *Numbers 10:26*: la troupe de la tribu des fils d’Aser était commandée
> par Phégiel, fils d'Ochran,
> *Numbers 12:8*: Je lui parle bouche à bouche, en me faisant voir, et non
> par énigmes, et il contemple la figure de Yahweh. Pourquoi donc n'avez-vous
> pas craint de parler contre mon serviteur, contre Moïse ? »
> *Numbers 12:12*: Ah ! Qu'elle ne soit pas comme l’enfant mort-né qui, en
> sortant du sein de sa mère, a la chair à demi-consumée ! »
> *Numbers 12:14*: Yahweh dit à Moïse : « Si son père lui avait craché au
> visage, ne serait-elle pas pendant sept jours couverte de honte ? Qu'elle
> soit séquestrée sept jours hors du camp ; après quoi, elle y sera reçue. »
> *Numbers 13:20*: ce qu’est le sol, s’il est gras ou maigre, s’il y a des
> arbres ou non. Ayez bon courage, et prenez des fruits du pays. » C'était le
> temps des premiers raisins.
> *Numbers 20:19*: Les enfants d’Israël lui dirent : « Nous monterons par
> la grande route, et, si nous buvons de ton eau, moi et mes troupeaux, j'en
> paierai le prix. Ce n'est pas une affaire ; je ne ferai que passer avec mes
> pieds. »
> *Numbers 22:3*: et Moab fut très effrayé en face du peuple, car celui-ci
> était nombreux ; il fut saisi d'épouvante en face des enfants d’Israël.
> *Numbers 31:18*: mais toutes les filles qui n'ont pas connu la couche
> d’un homme, laissez-les vivre pour vous.
> *Numbers 31:35*: et trente-deux mille d’entre les femmes qui n'avaient
> pas connu la couche d’un homme.
> *Numbers 32:23*: Mais si vous n'agissez pas ainsi, voici, vous péchez
> contre Yahweh ; et sachez que votre péché vous atteindra.
> *Numbers 32:33*: Moïse donna aux fils de Gad et aux fils de Ruben, et à
> la moitié de la tribu de Manassé, fils de Joseph, le royaume de Séhon, roi
> des Amorrhéens, et le royaume d'Og, roi de Basan, le pays avec ses villes
> et leurs territoires, les villes du pays d'alentour.
> *Numbers 32:40*: Moïse donna Galaad à Machir, fils de Manassé, qui s'y
> établit.
> *Numbers 33:2*: Moïse mit par écrit les lieux d'où ils partirent, selon
> leurs campements, d'après l’ordre de Yahweh, et voici leurs campements
> selon leurs départs :
> *Numbers 33:14*: Ils partirent d’Alus et campèrent à Raphidim, et il n'y
> eut pas là d’eau à boire pour le peuple.
> *Numbers 35:12*: Ces villes vous serviront de refuge contre le vengeur du
> sang, afin que le meurtrier ne soit pas mis à mort avant d'avoir comparu en
> jugement devant l’assemblée.
> *II Maccabees 15:32*: et il leur montra la tête du criminel Nicanor et la
> main que ce blasphémateur avait étendue avec tant d'insolence contre la
> demeure sainte du Tout-Puissant.
> *II Maccabees 15:33*: Puis, ayant coupé la langue de l'impie Nicanor, il
> voulut qu'on la donnât par morceaux en pâture aux oiseaux, et qu'on
> suspendit en face du temple le prix remporté par sa folie.
> *Jonah 2:8*: Quand mon âme défaillait en moi,
> je me suis souvenu de Yahweh ;
> et ma prière est parvenue jusqu'à vous,
> à votre saint temple.
>
>
> *Interesting that a majority of these are found in the same book!*
>
> Best regards,
>
> David
>
> Sent with Proton Mail <https://pr.tn/ref/SWXT9A5YZ67G> secure email.
>
> On Wednesday, March 19th, 2025 at 8:00 AM, David Haslam <
> dfhdfh at protonmail.com> wrote:
>
> A *Word Frequency* analysis on the *FreCrampon* text has uncovered 21
> instances of words where the *ordinary ASCII apostrophe* was used to mark
> *elision*, instead of the proper character U+2019 RIGHT SINGLE QUOTATION
> MARK used in all the other places.
>
> *Word* *Count*
> C'était 1
> Qu'elle 2
> d'Ochran 1
> d'Og 1
> d'alentour 1
> d'après 2
> d'avoir 1
> d'insolence 1
> d'où 1
> d'épouvante 1
> j'en 1
> jusqu'à 1
> l'impie 1
> n'agissez 1
> n'avaient 1
> n'avez-vous 1
> n'est 1
> n'ont 1
> n'y 1
> qu'on 2
> s'y 1
>
>
> These should each be changed to use U+2019.
>
> The issue should be fixed upstream in
> https://fr.wikisource.org/wiki/Bible_Crampon_1923
>
> FIO. The attached *7-Zip* file contains the *Word Frequency* analysis.
> NB. References were first stripped out, and both types of NBSP were
> replaced by an ordinary space.
>
> Best regards,
>
> David
>
> Sent with Proton Mail <https://pr.tn/ref/SWXT9A5YZ67G> secure email.
>
> On Tuesday, March 18th, 2025 at 10:02 PM, David Haslam <
> dfhdfh at protonmail.com> wrote:
>
> But see the continuation of my AI chat exchange in
> https://grok.com/share/bGVnYWN5_0023c289-2171-4f8b-8ad7-98e0f086eeb8
>
> It may still be preferable to use U+202F NARROW NO-BREAK SPACE [NNBSP] to
> separate the *Guillemots* from the word at start and end of each
> quotation.
>
> cf. This is already the case in French module *FreLXXGiguet*.
>
> If we go down that route consistently, then some *preprocessing* would be
> required before performing a *Word Frequency* analysis on the module's
> text content.
> *i.e. As part of module testing, in order to uncover any further anomalies*
> .
>
> Best regards,
>
> David
>
> Sent with Proton Mail <https://pr.tn/ref/SWXT9A5YZ67G> secure email.
>
> On Tuesday, March 18th, 2025 at 9:42 PM, David Haslam <
> dfhdfh at protonmail.com> wrote:
>
> *I hadn't thought of doing this analysis until today*.
>
> My recent detailed observations about the *FreBBB* module also are
> applicable to *FreCampon*.
>
> *FreCrampon* contains 22143 U+00A0 NO BREAK SPACE (NBSP)
>
> Of these, 6152 are not followed immediately by a punctuation mark!
> All but one of those are followed by a word character.
>
> This means that 15991 of the NBSP are *followed by* a punctuation mark.
>
> All 6151 of the othe locations match the PCRE *[[:punct:]]\xA0\w+*
>
> i.e. These are each *preceded by* a punctuation mark.
>
> I therefore recommend that each NBSP be replaced by U+2008 PUNCTUATION
> SPACE
>
> The 1 exception out of the 6152 is where the NBSP occurs strangely at the
> end of a verse!
> *Mark 2:22*: Et personne ne met du vin nouveau dans des outres vieilles :
> autrement, le vin fait rompre les outres et le vin se répand, et les outres
> sont perdues. Mais le vin nouveau doit se mettre dans des outres neuves. «
>
>
> i.e. It's the invisible character after an ordinary space after the «
> That « may well be a typo, as it should surely be a »
>
> To sum up: Replace all U+00A0 by U+2008 and correct the above typo!
>
> We should advise the upstream source to do likewise!
>
> Best regards,
>
> David
>
> Sent with Proton Mail <https://pr.tn/ref/SWXT9A5YZ67G> secure email.
>
>
> On Monday, March 10th, 2025 at 9:51 AM, domcox at crosswire.org
> domcox at crosswire.org wrote:
>
> Dear All,
>
> This is to announce that we have just now uploaded FreCrampon
> in the CrossWire (main) repository.
>
> ## Language:
> French
>
> ## Description:
> La Bible Augustin Crampon 1923
>
> ## Category:
> Biblical Text
>
> ## Version:
> This is an update. Version: 3.2
>
> ## What's new:
> Complete rereading of the whole Bible, correction of NT cross-references.
>
> Many thanks to Cyrille_LAfricain for the hard work.
>
> We wish you enjoyable reading,
> The Module Team
>
> P.S.: This email is sent automatically on upload of a new/updated module
>
> _______________________________________________
> sword-devel mailing list: sword-devel at crosswire.org
> http://crosswire.org/mailman/listinfo/sword-devel
> Instructions to unsubscribe/change your settings at above page
>
>
>
>
> _______________________________________________
> sword-devel mailing list: sword-devel at crosswire.org
> http://crosswire.org/mailman/listinfo/sword-devel
> Instructions to unsubscribe/change your settings at above page
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://crosswire.org/pipermail/sword-devel/attachments/20250319/0797de95/attachment-0001.htm>


More information about the sword-devel mailing list