<div style="font-family: Arial, sans-serif; font-size: 14px;">But see the continuation of my AI chat exchange in <span><a target="_blank" rel="noreferrer nofollow noopener" href="https://grok.com/share/bGVnYWN5_0023c289-2171-4f8b-8ad7-98e0f086eeb8">https://grok.com/share/bGVnYWN5_0023c289-2171-4f8b-8ad7-98e0f086eeb8</a></span></div><div style="font-family: Arial, sans-serif; font-size: 14px;"><br></div><div style="font-family: Arial, sans-serif; font-size: 14px;">It may still be preferable to use <span>U+202F NARROW NO-BREAK SPACE [NNBSP] to separate the <b>Guillemots</b> from the word at start and end of each quotation.</span></div><div style="font-family: Arial, sans-serif; font-size: 14px;"><span><br></span></div><div style="font-family: Arial, sans-serif; font-size: 14px;"><span>cf. This is already the case in <span style="display: inline !important; background-color: rgb(255, 255, 255);">French<span> </span></span>module <b>FreLXXGiguet</b>.</span></div><div style="font-family: Arial, sans-serif; font-size: 14px;"><br></div><div style="font-family: Arial, sans-serif; font-size: 14px;">If we go down that route consistently, then some <b>preprocessing</b> would be required before performing a <b>Word Frequency</b> analysis on the module's text content.</div><div style="font-family: Arial, sans-serif; font-size: 14px;"><i>i.e. As part of module testing, in order to uncover any further anomalies</i>.</div><div style="font-family: Arial, sans-serif; font-size: 14px;"><br></div>
<div class="protonmail_signature_block" style="font-family: Arial, sans-serif; font-size: 14px;">
    <div class="protonmail_signature_block-user">
        Best regards,<br><br>David
    </div>
    <div style="font-family: Arial, sans-serif; font-size: 14px;"><br></div>
    <div class="protonmail_signature_block-proton">
        Sent with <a target="_blank" href="https://pr.tn/ref/SWXT9A5YZ67G">Proton Mail</a> secure email.
    </div>
</div>
<div style="font-family: Arial, sans-serif; font-size: 14px;"><br></div><div class="protonmail_quote">
        On Tuesday, March 18th, 2025 at 9:42 PM, David Haslam <dfhdfh@protonmail.com> wrote:<br>
        <blockquote class="protonmail_quote" type="cite">
            <div style="font-family: Arial, sans-serif; font-size: 14px;"><p><i>I hadn't thought of doing this analysis until today</i>.</p><p>My recent <span style="scrollbar-width: thin; background-color: rgb(255, 255, 255);">detailed </span>observations about the <b>FreBBB</b> module also are applicable to <b>FreCampon</b>.<br>
<br>
<b>FreCrampon</b> contains <span>22143 U+00A0 NO BREAK SPACE (NBSP)</span></p><p>Of these, 6152 are not followed immediately by a punctuation mark!<br>
All but one of those are followed by a word character.</p><p>This means that 15991 of the NBSP are <u>followed by</u> a punctuation mark.</p><p>All 6151 of the othe locations match the PCRE <span><b>[[:punct:]]\xA0\w+</b></span></p><p>i.e. These are each <u>preceded by</u> a punctuation mark.</p><p>I therefore recommend that each NBSP be replaced by <span>U+2008 PUNCTUATION SPACE</span></p><p>
The 1 exception out of the 6152 is where the NBSP occurs strangely at the end of a verse!</p><div style="margin-top: 14px; margin-bottom: 14px;"><span><b>Mark 2:22</b>: Et personne ne met du vin nouveau dans des outres vieilles : autrement, le vin fait rompre les outres et le vin se répand, et les outres sont perdues. Mais le vin nouveau doit se mettre dans des outres neuves. «    </span><br><span></span><br>
i.e. It's the invisible character after an ordinary space after the <span style="display: inline !important; background-color: rgb(255, 255, 255);">«</span></div><div style="font-family: Arial, sans-serif; font-size: 14px;" class="protonmail_signature_block">
    <div class="protonmail_signature_block-user">That <span style="display: inline !important; background-color: rgb(255, 255, 255);">«</span> may well be a typo, as it should surely be a <span>»</span> </div><div class="protonmail_signature_block-user"><br></div><div class="protonmail_signature_block-user">To sum up: Replace all U+00A0 by U+2008 and correct the above typo!</div><div class="protonmail_signature_block-user"><br></div><div class="protonmail_signature_block-user">We should advise the upstream source to do likewise!</div><div class="protonmail_signature_block-user"><br></div><div class="protonmail_signature_block-user">
        Best regards,<br><br>David
    </div>
    <div style="font-family: Arial, sans-serif; font-size: 14px;"><br></div>
    <div class="protonmail_signature_block-proton">
        Sent with <a href="https://pr.tn/ref/SWXT9A5YZ67G" target="_blank" rel="noreferrer nofollow noopener">Proton Mail</a> secure email.
    </div>
</div>
<br>
<br>
On Monday, March 10th, 2025 at 9:51 AM, <a href="mailto:domcox@crosswire.org" rel="noreferrer nofollow noopener">domcox@crosswire.org</a> <a href="mailto:domcox@crosswire.org" rel="noreferrer nofollow noopener">domcox@crosswire.org</a> wrote:<p></p>
<p></p>
<blockquote>
<p>Dear All,</p>
<p>This is to announce that we have just now uploaded FreCrampon<br>
in the CrossWire (main) repository.</p>
<p>## Language:<br>
French</p>
<p>## Description:<br>
La Bible Augustin Crampon 1923</p>
<p>## Category:<br>
Biblical Text</p>
<p>## Version:<br>
This is an update. Version: 3.2</p>
<p>## What's new:<br>
Complete rereading of the whole Bible, correction of NT cross-references.</p>
<p>Many thanks to Cyrille_LAfricain for the hard work.</p>
<p>We wish you enjoyable reading,<br>
The Module Team</p>
<p>P.S.: This email is sent automatically on upload of a new/updated module</p>
<p>_______________________________________________<br>
sword-devel mailing list: <a href="mailto:sword-devel@crosswire.org" rel="noreferrer nofollow noopener">sword-devel@crosswire.org</a><br>
<a href="http://crosswire.org/mailman/listinfo/sword-devel" target="_blank" rel="noreferrer nofollow noopener">http://crosswire.org/mailman/listinfo/sword-devel</a><br>
Instructions to unsubscribe/change your settings at above page</p>
</blockquote></div>
        </blockquote><br>
    </div>