<html><head><meta http-equiv="Content-Type" content="text/html charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">Thanks David and Peter.<div class=""><br class=""></div><div class="">This module ERtr_en has been around since 2002. No one has complained. Every one of the first 26 examples are wrong. (according to Google translate) Even the one for Christ! I’m of the opinion that the module should be taken down as being bad and not of value. I don’t have the time or inclination to update it.<div class=""><br class=""></div><div class="">I found the Ergane website from where the data was obtained. The data is still there, but I can’t run the Ergane 8.0 windows software under Windows 10 to see the data. So I can’t tell if it is a useful source. The latest date (2005) is more recent than our module. So, according to our current practices, this should be gotten from upstream, not downstream.</div><div class=""><div class=""><br class=""></div><div class="">I went to <a href="http://wordgumbo.com" class="">wordgumbo.com</a>&nbsp;via the Internet Wayback Machine (as the site is currently unavailable) and found the listing. There it is showing&nbsp;<span style="font-family: -webkit-standard; font-size: medium;" class="">a</span><span style="font-family: -webkit-standard; font-size: medium;" class="">g</span><sup style="font-family: -webkit-standard;" class="">u</sup><span style="font-family: -webkit-standard; font-size: medium;" class="">ustos: 1. August.</span>&nbsp;When I view the source I see a&lt;!u 011f&gt;g&lt;sup&gt;u&lt;/sup&gt;ustos. The &lt;!u 011f&gt; is my browser’s debugger’s representation for the non-printing character.</div><div class=""><br class=""></div><div class="">I looked up 011F and it is the code for&nbsp;ğ&nbsp;in the MacTurkish encoding. 011E is for&nbsp;Ğ. Respectively these are codepoints 219 and 218 in UTF-8. I didn’t look at other&nbsp;encodings.<br class=""></div><div class=""><br class=""></div><div class="">Here is a summary of the number of times that this occurs for the number of entries.</div><div class="">[ERtr_en] Ergane Turkish to English Glossary</div><div class=""><span class="Apple-tab-span" style="white-space: pre;">        </span>Entries=1029 Errors=47</div><div class=""><br class=""></div><div class="">The other LexDict modules that are exhibiting the same problems (invalid UTF-8 character):</div><div class="">[EReo_en] Ergane Esperanto to English Glossary<br class=""><span class="Apple-tab-span" style="white-space:pre">        </span>Entries=16852 Errors=1118<br class="">&nbsp;[ERja_en] Ergane Japanese to English Glossary<br class=""><span class="Apple-tab-span" style="white-space:pre">        </span>Entries=552 Errors=21<br class="">[ERpo_en] Ergane Polish to English Glossary<br class=""><span class="Apple-tab-span" style="white-space:pre">        </span>Entries=2026 Errors=650<br class="">[ERro_en] Ergane Romanian to English Glossary<br class=""><span class="Apple-tab-span" style="white-space:pre">        </span>Entries=1218 Errors=264<br class="">[ERru_en] Ergane Russian to English Glossary<br class=""><span class="Apple-tab-span" style="white-space:pre">        </span>Entries=1225 Errors=100</div><div class=""><br class=""></div><div class="">I’m also debugging a different set of problems I’m having with [ERde_en] Ergane German to English Glossary.</div><div class=""><br class=""></div><div class="">I’m suspicious about all the Ergane modules built from WordGumbo.</div><div class=""><br class=""></div><div class="">In Him,</div><div class=""><span class="Apple-tab-span" style="white-space:pre">        </span>DM</div><div class=""><br class=""></div><div class=""><br class=""></div><div class=""><div><blockquote type="cite" class=""><div class="">On Jan 5, 2016, at 10:33 AM, David Haslam &lt;<a href="mailto:dfhmch@googlemail.com" class="">dfhmch@googlemail.com</a>&gt; wrote:</div><br class="Apple-interchange-newline"><div class=""><div class="">For the word you cited as an example, the missing letter would be Ğ.<br class=""><br class="">The word is AĞUSTOS = Ağustos = the name of the month August.<br class=""><br class="">Given enough samples, it may be feasible to reconstruct the mapping table<br class="">without external help.<br class=""><br class="">This site may help.<br class=""><br class=""><a href="http://en.bab.la/dictionary/turkish-english/a%C4%9Fustos" class="">http://en.bab.la/dictionary/turkish-english/a%C4%9Fustos</a><br class=""><br class="">Regards,<br class=""><br class="">David<br class=""><br class=""><br class=""><br class="">--<br class="">View this message in context: http://sword-dev.350566.n4.nabble.com/Turkish-to-English-glossary-problem-tp4655585p4655588.html<br class="">Sent from the SWORD Dev mailing list archive at Nabble.com.<br class=""><br class="">_______________________________________________<br class="">sword-devel mailing list: sword-devel@crosswire.org<br class="">http://www.crosswire.org/mailman/listinfo/sword-devel<br class="">Instructions to unsubscribe/change your settings at above page</div></div></blockquote></div><br class=""></div></div></div></body></html>