[sword-svn] r240 - trunk/source/data/translit/crosswire
chrislit at crosswire.org
chrislit at crosswire.org
Sat Nov 9 16:17:36 MST 2013
Author: chrislit
Date: 2013-11-09 16:17:36 -0700 (Sat, 09 Nov 2013)
New Revision: 240
Modified:
trunk/source/data/translit/crosswire/Any_Latin1.txt
trunk/source/data/translit/crosswire/CanadianAboriginal_Latin.txt
trunk/source/data/translit/crosswire/Inuktitut_Latin.txt
trunk/source/data/translit/crosswire/Phoenician_Latin.txt
trunk/source/data/translit/crosswire/Phoenician_Latin_Beta.txt
trunk/source/data/translit/crosswire/Thaana_Latin_ALALC.txt
Log:
reverted some files that lost information
Modified: trunk/source/data/translit/crosswire/Any_Latin1.txt
===================================================================
--- trunk/source/data/translit/crosswire/Any_Latin1.txt 2013-11-09 06:09:54 UTC (rev 239)
+++ trunk/source/data/translit/crosswire/Any_Latin1.txt 2013-11-09 23:17:36 UTC (rev 240)
@@ -1,4 +1,11 @@
-:: NFKC ();
-:: [^ -ÿ] NFD ();
+# Any-Latin-1
+
+# NFKD then NFC; then NFD all non-Latin-1 codepoints
+:: NFKC ();
+:: [^\u0000-\u00FF] NFD ();
+
+# remove non-spacing marks
[:Mn:]>;
-[^ -ÿ]>'?';
+
+# change characters outside of Latin-1 range to query
+[^\u0000-\u00FF]>'?';
Modified: trunk/source/data/translit/crosswire/CanadianAboriginal_Latin.txt
===================================================================
--- trunk/source/data/translit/crosswire/CanadianAboriginal_Latin.txt 2013-11-09 06:09:54 UTC (rev 239)
+++ trunk/source/data/translit/crosswire/CanadianAboriginal_Latin.txt 2013-11-09 23:17:36 UTC (rev 240)
@@ -1,182 +1,191 @@
-šwê <> ᔗ ;
-šwî <> ᔛ ;
-šwi <> ᔙ ;
-šwô <> ᔟ ;
-šwo <> ᔝ ;
-šwâ <> ᔣ ;
-šwa <> ᔡ ;
-pwê <> ᐺ ;
-pwî <> ᐾ ;
+# ***************************************************************************
+# *
+# * Copyright (C) 2004-2006, International Business Machines
+# * Corporation; Unicode, Inc.; and others. All Rights Reserved.
+# *
+# ***************************************************************************
+# File: CanadianAboriginal_Latin.txt
+# Generated from CLDR: Thu Jul 20 14:57:44 PDT 2006
+#
+šwê <> ᔗ ;
+šwî <> ᔛ ;
+šwi <> ᔙ ;
+šwô <> ᔟ ;
+šwo <> ᔝ ;
+šwâ <> ᔣ ;
+šwa <> ᔡ ;
+pwê <> ᐺ ;
+pwî <> ᐾ ;
pwi <> ᐼ ;
-pwô <> ᑂ ;
+pwô <> ᑂ ;
pwo <> ᑀ ;
-pwâ <> ᑆ ;
+pwâ <> ᑆ ;
pwa <> ᑄ ;
-twê <> ᑗ ;
-twî <> ᑛ ;
+twê <> ᑗ ;
+twî <> ᑛ ;
twi <> ᑙ ;
-twô <> ᑟ ;
+twô <> ᑟ ;
two <> ᑝ ;
-twâ <> ᑣ ;
+twâ <> ᑣ ;
twa <> ᑡ ;
-kwê <> ᑴ ;
-kwî <> ᑸ ;
+kwê <> ᑴ ;
+kwî <> ᑸ ;
kwi <> ᑶ ;
-kwô <> ᑼ ;
+kwô <> ᑼ ;
kwo <> ᑺ ;
-kwâ <> ᒀ ;
+kwâ <> ᒀ ;
kwa <> ᑾ ;
-cwê <> ᒒ ;
-cwî <> ᒖ ;
+cwê <> ᒒ ;
+cwî <> ᒖ ;
cwi <> ᒔ ;
-cwô <> ᒚ ;
+cwô <> ᒚ ;
cwo <> ᒘ ;
-cwâ <> ᒞ ;
+cwâ <> ᒞ ;
cwa <> ᒜ ;
-mwê <> ᒬ ;
-mwî <> ᒰ ;
+mwê <> ᒬ ;
+mwî <> ᒰ ;
mwi <> ᒮ ;
-mwô <> ᒴ ;
+mwô <> ᒴ ;
mwo <> ᒲ ;
-mwâ <> ᒸ ;
+mwâ <> ᒸ ;
mwa <> ᒶ ;
-nwê <> ᓉ ;
-nwâ <> ᓍ ;
+nwê <> ᓉ ;
+nwâ <> ᓍ ;
nwa <> ᓋ ;
-lwê <> ᓜ ;
-lwî <> ᓠ ;
+lwê <> ᓜ ;
+lwî <> ᓠ ;
lwi <> ᓞ ;
-lwô <> ᓤ ;
+lwô <> ᓤ ;
lwo <> ᓢ ;
-lwâ <> ᓨ ;
+lwâ <> ᓨ ;
lwa <> ᓦ ;
-swê <> ᓶ ;
-swî <> ᓺ ;
+swê <> ᓶ ;
+swî <> ᓺ ;
swi <> ᓸ ;
-swô <> ᓾ ;
+swô <> ᓾ ;
swo <> ᓼ ;
-swâ <> ᔂ ;
+swâ <> ᔂ ;
swa <> ᔀ ;
-ywê <> ᔯ ;
-ywî <> ᔳ ;
+ywê <> ᔯ ;
+ywî <> ᔳ ;
ywi <> ᔱ ;
-ywô <> ᔷ ;
+ywô <> ᔷ ;
ywo <> ᔵ ;
-ywâ <> ᔻ ;
+ywâ <> ᔻ ;
ywa <> ᔹ ;
-rwâ <> ᕎ ;
+rwâ <> ᕎ ;
hk <> ᕽ ;
-thê <> ᖧ ;
-thî <> ᖩ ;
+thê <> ᖧ ;
+thî <> ᖩ ;
thi <> ᖨ ;
-thô <> ᖫ ;
+thô <> ᖫ ;
tho <> ᖪ ;
-thâ <> ᖭ ;
+thâ <> ᖭ ;
tha <> ᖬ ;
th <> ᖮ ;
-šê <> ᔐ ;
-šî <> ᔑ ;
-ši <> ᔒ ;
-šô <> ᔓ ;
-šo <> ᔔ ;
-šâ <> ᔕ ;
-ša <> ᔖ ;
-š <> ᔥ ;
-wê <> ᐌ ;
-wî <> ᐐ ;
+šê <> ᔐ ;
+šî <> ᔑ ;
+ši <> ᔒ ;
+šô <> ᔓ ;
+šo <> ᔔ ;
+šâ <> ᔕ ;
+ša <> ᔖ ;
+š <> ᔥ ;
+wê <> ᐌ ;
+wî <> ᐐ ;
wi <> ᐎ ;
-wô <> ᐔ ;
+wô <> ᐔ ;
wo <> ᐒ ;
-wâ <> ᐙ ;
+wâ <> ᐙ ;
wa <> ᐗ ;
w <> ᐤ ;
-pê <> ᐯ ;
-pî <> ᐲ ;
+pê <> ᐯ ;
+pî <> ᐲ ;
pi <> ᐱ ;
-pô <> ᐴ ;
+pô <> ᐴ ;
po <> ᐳ ;
-pâ <> ᐹ ;
+pâ <> ᐹ ;
pa <> ᐸ ;
p <> ᑉ ;
-tê <> ᑌ ;
-tî <> ᑏ ;
+tê <> ᑌ ;
+tî <> ᑏ ;
ti <> ᑎ ;
-tô <> ᑑ ;
+tô <> ᑑ ;
to <> ᑐ ;
-tâ <> ᑖ ;
+tâ <> ᑖ ;
ta <> ᑕ ;
t <> ᑦ ;
-kê <> ᑫ ;
-kî <> ᑮ ;
+kê <> ᑫ ;
+kî <> ᑮ ;
ki <> ᑭ ;
-kô <> ᑰ ;
+kô <> ᑰ ;
ko <> ᑯ ;
-kâ <> ᑳ ;
+kâ <> ᑳ ;
ka <> ᑲ ;
kw <> ᒄ ;
k <> ᒃ ;
-cê <> ᒉ ;
-cî <> ᒌ ;
+cê <> ᒉ ;
+cî <> ᒌ ;
ci <> ᒋ ;
-cô <> ᒎ ;
+cô <> ᒎ ;
co <> ᒍ ;
-câ <> ᒑ ;
+câ <> ᒑ ;
ca <> ᒐ ;
c <> ᒡ ;
-mê <> ᒣ ;
-mî <> ᒦ ;
+mê <> ᒣ ;
+mî <> ᒦ ;
mi <> ᒥ ;
-mô <> ᒨ ;
+mô <> ᒨ ;
mo <> ᒧ ;
-mâ <> ᒫ ;
+mâ <> ᒫ ;
ma <> ᒪ ;
m <> ᒻ ;
-nê <> ᓀ ;
-nî <> ᓃ ;
+nê <> ᓀ ;
+nî <> ᓃ ;
ni <> ᓂ ;
-nô <> ᓅ ;
+nô <> ᓅ ;
no <> ᓄ ;
-nâ <> ᓈ ;
+nâ <> ᓈ ;
na <> ᓇ ;
n <> ᓐ ;
-lê <> ᓓ ;
-lî <> ᓖ ;
+lê <> ᓓ ;
+lî <> ᓖ ;
li <> ᓕ ;
-lô <> ᓘ ;
+lô <> ᓘ ;
lo <> ᓗ ;
-lâ <> ᓛ ;
+lâ <> ᓛ ;
la <> ᓚ ;
l <> ᓪ ;
-sê <> ᓭ ;
-sî <> ᓰ ;
+sê <> ᓭ ;
+sî <> ᓰ ;
si <> ᓯ ;
-sô <> ᓲ ;
+sô <> ᓲ ;
so <> ᓱ ;
-sâ <> ᓵ ;
+sâ <> ᓵ ;
sa <> ᓴ ;
s <> ᔅ ;
-yê <> ᔦ ;
-yî <> ᔩ ;
+yê <> ᔦ ;
+yî <> ᔩ ;
yi <> ᔨ ;
-yô <> ᔫ ;
+yô <> ᔫ ;
yo <> ᔪ ;
-yâ <> ᔮ ;
+yâ <> ᔮ ;
ya <> ᔭ ;
y <> ᔾ ;
-rê <> ᕂ ;
-rî <> ᕇ ;
+rê <> ᕂ ;
+rî <> ᕇ ;
ri <> ᕆ ;
-rô <> ᕉ ;
+rô <> ᕉ ;
ro <> ᕈ ;
-râ <> ᕌ ;
+râ <> ᕌ ;
ra <> ᕋ ;
r <> ᕐ ;
-hê <> ᐁ ;
-hî <> ᐄ ;
+hê <> ᐁ ;
+hî <> ᐄ ;
hi <> ᐃ ;
-hô <> ᐆ ;
+hô <> ᐆ ;
ho <> ᐅ ;
-hâ <> ᐋ ;
+hâ <> ᐋ ;
ha <> ᐊ ;
h <> ᐦ ;
'.' <> ᙮ ;
Modified: trunk/source/data/translit/crosswire/Inuktitut_Latin.txt
===================================================================
--- trunk/source/data/translit/crosswire/Inuktitut_Latin.txt 2013-11-09 06:09:54 UTC (rev 239)
+++ trunk/source/data/translit/crosswire/Inuktitut_Latin.txt 2013-11-09 23:17:36 UTC (rev 240)
@@ -1,4 +1,8 @@
#--------------------------------------------------------------------
+# Copyright 2012, CrossWire Bible Society (www.crosswire.org)
+# All rights reserved. Usage permitted according to the MIT/X11
+# License: http://www.opensource.org/licenses/mit-license.php
+#--------------------------------------------------------------------
# Based on the standardized Inuit Cultural Institute mapping of
# qaniujaaqpait to qaliujaaqpait via Daniels & Bright p.607,
# supplemented with mappings from (but not to) Unicode characters
@@ -6,6 +10,7 @@
#--------------------------------------------------------------------
# Latin-Inuktitut/ICI
:: [A-Z] Lower();
+
# completeness mappings
b > |p ;
d > |t ;
@@ -17,6 +22,7 @@
x > |ks ;
y > |j ;
z > |s ;
+
# nng- series
nngii < ᙲ ;
nngi < ᙱ ;
@@ -25,6 +31,7 @@
nngaa < ᙶ ;
nnga < ᙵ ;
nng < ᖖ ;
+
# ng- series
ngaai < ᖎ ;
ngai < ᙰ ;
@@ -35,6 +42,7 @@
ngaa <> ᖔ ;
nga <> ᖓ ;
ng <> ᖕ ;
+
# p- series
paai < ᐰ ;
pai < ᐯ ;
@@ -45,6 +53,7 @@
paa <> ᐹ ;
pa <> ᐸ ;
p <> ᑉ ;
+
# t- series
taai < ᑍ ;
tai < ᑌ ;
@@ -55,6 +64,7 @@
taa <> ᑖ ;
ta <> ᑕ ;
t <> ᑦ ;
+
# k- series
kaai < ᑬ ;
kai < ᑫ ;
@@ -65,6 +75,7 @@
kaa <> ᑳ ;
ka <> ᑲ ;
k <> ᒃ ;
+
# g- series
gaai < ᒊ ;
gai < ᒉ ;
@@ -75,6 +86,7 @@
gaa <> ᒑ ;
ga <> ᒐ ;
g <> ᒡ ;
+
# m- series
maai < ᒤ ;
mai < ᒣ ;
@@ -85,6 +97,7 @@
maa <> ᒫ ;
ma <> ᒪ ;
m <> ᒻ ;
+
# n- series
naai < ᓁ ;
nai < ᓀ ;
@@ -95,6 +108,7 @@
naa <> ᓈ ;
na <> ᓇ ;
n <> ᓐ ;
+
# s- series
saai < ᓮ ;
sai < ᓭ ;
@@ -105,6 +119,7 @@
saa <> ᓵ ;
sa <> ᓴ ;
s <> ᔅ ;
+
# l- series
laai < ᓔ ;
lai < ᓓ ;
@@ -115,6 +130,7 @@
laa <> ᓛ ;
la <> ᓚ ;
l <> ᓪ ;
+
# j- series
jaai < ᔧ ;
jai < ᔦ ;
@@ -125,6 +141,7 @@
jaa <> ᔮ ;
ja <> ᔭ ;
j <> ᔾ ;
+
# v- series
vaai < ᕔ ;
vai < ᕓ ;
@@ -135,6 +152,7 @@
vaa <> ᕚ ;
va <> ᕙ ;
v <> ᕝ ;
+
# r- series
raai < ᕅ ;
rai < ᕂ ;
@@ -145,6 +163,7 @@
raa <> ᕌ ;
ra <> ᕋ ;
r <> ᕐ ;
+
# q- series
qaai < ᕾ ;
qai < ᙯ ;
@@ -155,6 +174,7 @@
qaa <> ᖄ ;
qa <> ᖃ ;
q <> ᖅ ;
+
# ł- series
łii <> ᖡ ;
łi <> ᖠ ;
@@ -163,6 +183,7 @@
łaa <> ᖥ ;
ła <> ᖤ ;
ł <> ᖦ ;
+
# &- (alternate ł-) series
'&ii' > ᖡ ;
'&i' > ᖠ ;
@@ -171,6 +192,7 @@
'&aa' > ᖥ ;
'&a' > ᖤ ;
'&' > ᖦ ;
+
# Nunavik h- series
hai < ᕴ ;
hii < ᕶ ;
@@ -180,11 +202,14 @@
haa < ᕺ ;
ha < ᕹ ;
h < ᕻ ;
+
# Nunavut h
h < ᕼ ;
h < H;
+
# Aivilik b
b < ᖯ;
+
# vocalic series
aai < ᐂ ;
ai < ᐁ ;
@@ -196,6 +221,7 @@
a <> ᐊ ;
h <> ᐦ ;
\' <> ᐟ ;
-# punctuation
+
+# punctuation
'-' < ᐀ ;
'.' < ᙮ ;
Modified: trunk/source/data/translit/crosswire/Phoenician_Latin.txt
===================================================================
--- trunk/source/data/translit/crosswire/Phoenician_Latin.txt 2013-11-09 06:09:54 UTC (rev 239)
+++ trunk/source/data/translit/crosswire/Phoenician_Latin.txt 2013-11-09 23:17:36 UTC (rev 240)
@@ -1,11 +1,18 @@
#---------------------------------------------------------------------
+# Copyright 2009, CrossWire Bible Society (www.crosswire.org)
+# All rights reserved. Usage permitted according to the MIT/X11
+# License: http://www.opensource.org/licenses/mit-license.php
+#---------------------------------------------------------------------
# Phoenician-Latin
:: NFD (NFC);
$letter=[[:L:][\)\+\(\`\:\&\$\#]];
+
𐤇<>ḥ;
𐤈<>ṭ;
+
𐤑<>ṣ;
𐤔<š;
+
𐤀<>ʾ;
𐤁<>b;
𐤂<>g;
Modified: trunk/source/data/translit/crosswire/Phoenician_Latin_Beta.txt
===================================================================
--- trunk/source/data/translit/crosswire/Phoenician_Latin_Beta.txt 2013-11-09 06:09:54 UTC (rev 239)
+++ trunk/source/data/translit/crosswire/Phoenician_Latin_Beta.txt 2013-11-09 23:17:36 UTC (rev 240)
@@ -1,4 +1,8 @@
#---------------------------------------------------------------------
+# Copyright 2009, CrossWire Bible Society (www.crosswire.org)
+# All rights reserved. Usage permitted according to the MIT/X11
+# License: http://www.opensource.org/licenses/mit-license.php
+#---------------------------------------------------------------------
# Based on Beta code for CCAT/Michigan-Claremont:
# http://ccat.sas.upenn.edu/gopher/text/religion/biblical/0-betacode.txt
#---------------------------------------------------------------------
@@ -35,14 +39,14 @@
𐤗<>10;
𐤖<>1;
𐤟<>' ';
->':';
->I;
->'\"';
->E;
->A;
->F;
->O;
->U;
->[0-9];
+<':';
+<I;
+<'\"';
+<E;
+<A;
+<F;
+<O;
+<U;
+<[0-9];
:: ([$letter] upper);
:: NFC (NFD);
Modified: trunk/source/data/translit/crosswire/Thaana_Latin_ALALC.txt
===================================================================
--- trunk/source/data/translit/crosswire/Thaana_Latin_ALALC.txt 2013-11-09 06:09:54 UTC (rev 239)
+++ trunk/source/data/translit/crosswire/Thaana_Latin_ALALC.txt 2013-11-09 23:17:36 UTC (rev 240)
@@ -1,11 +1,16 @@
#--------------------------------------------------------------------
+# Copyright 2001-2009, CrossWire Bible Society (www.crosswire.org)
+# All rights reserved. Usage permitted according to the MIT/X11
+# License: http://www.opensource.org/licenses/mit-license.php
+#--------------------------------------------------------------------
# Based ALA-LC Romanization from
# http://lcweb.loc.gov/catdir/cpso/romanization/divehi.pdf
#--------------------------------------------------------------------
# This transform definitely needs more attention
# Thaana-Latin/ALALC
:: NFD (NFC);
-$consonants = [ހ-ޥ];
+$consonants = [\u0780-\u07A5];
+
ށް}[:^L:]>ḫ;
ށް}[$consonants]>ḫ;
ތްތ<>t̤t;
More information about the sword-cvs
mailing list