metadata {
authority_id: alalc id: 1997 language: iso-639-2:sin source_script: Sinh destination_script: Latn name: Romanization Table -- Sinhalese (1997) url: http://catdir.loc.gov/catdir/cpso/romanization/sinhales.pdf creation_date: 1997 description: | ALA-LC Romanization table for Sinhalese notes: - Only the vowel forms that appear at the beginning of a syllable are listed; the forms used for vowels following a consonant can be found in grammars; no distinction between the two is made in transliteration. - | The vowel a is implicit after all consonants and consonant clusters and is supplied in transliteration, with the following exceptions: a) when another vowel is indicated by its appropriate sign; and b) when the absence of any vowel is indicated by the sign ් called virāma. - | Exceptions: Anusvāra is transliterated by: a) ṅ before gutturals, b) ñ before palatals, c) ṇ before cerebrals, d) n before dentals, and e) m before labials. - | Exceptions: a) when saññaka represents a nasal, it is romanized according to the rule for anusvāra. b) when saññaka is combined with an aspirated consonant, the combination is romanized as a non-aspirated, followed by an aspirated consonant.
}
tests {
test "ශී්ර ලංකාවේ කී්රඩාව ඉතිහාසයේ ඉහළම තැනකට ගේන්න කටයුතු කරනවා", "śīra laṃkāvē kīraḍāva itihāsayē ihaḷama tănakaṭa gēnanna kaṭayutu karanavā" test "කොච්චිකඬේ මෝයකට අසල නෑමට ගිය තරුණයෝ ෩ක් මරුට - මිතුරාගේ උපන් දිනය සැමරීමට ඇවිත්", "kocañcikaṇḍē mōyakaṭa asala nâmaṭa giya taruṇayō 3k maruṭa - miturāgē upan dinaya sămarīmaṭa ăvit" test "ලෝක ළමා දිනයදා සිසුන් පිරිසක් කසිප්පු බීලා", "lōka ḷamā dinayadā sisun pirisak kasippu bīlā" test "කෝටි 16ක හෙරොයින් සමග දන්කොටුවේදී 7ක් දැලේ", "kōṭi 16ka heroyin samaga danaṅkoṭuvēdī 7k dălē" test "මිනුවන්ගොඩ පීසීආර් දෙදහසක් සිදුකරයි", "minuvanaṅgoḍa pīsīār dedahasak sidukarayi" test "පාස්කු ප්රහාරය වගේම පාස්කු ප්රෝඩාව ගැනත් සොයන්න කොමිසමක් පත්කළ යුතුයි - විපක්ෂ නායක සජිත් පේ්රමදාස", "pāsaṅku parahāraya vagēma pāsaṅku prōḍāva gănat soyananna komisamak pataṅkaḷa yutuyi - vipakṣa nāyaka sajit pēramadāsa" test "ට්රම්ප්ගේ සෞඛ්යය තීරණාත්මකයි - ට්විටර් හරහා ජනතාව අමතයි", "ṭarampaṅgē saukhyaya tīraṇātmakayi - ṭviṭar harahā janatāva amatayi" test "පාස්කු දා ප්රහාරය පිළිබඳ පරීක්ෂණවලින් කිසිවකුට අසාධාරණයක් වීමට ඉඩ දෙන්නේ නෑ - අගමැති", "pāsaṅku dā parahāraya piḷibanda parīkṣaṇavalin kisivakuṭa asādhāraṇayak vīmaṭa iḍa denannē nâ - agamăti" test "දිල්ලි කැපිටල්ස් සහ කෝලිගේ බැංගලෝර් තෙවැනි ජය ලබයි", "dilli kăpiṭals saha kōligē băṃgalōr tevăni jaya labayi" test "ශ්රී ලාංකික සම්භවයක් සහිත ප්රංශයේ පවුලක 5 ක් ඝාතනය කරලා", "śarī lāṃkika sambhavayak sahita paraṃśayē pavulaka 5 k ghātanaya karalā" test "පැතිකුදය ඉක්මනින් සුව කරන ප්රතිකාර", "pătikudaya ikmanin suva karana paratikāra"
}
aliases {
def_alias sinh_chars_1, any("\u0dcf\u0dd0\u0dd1\u0dd2\u0dd3\u0dd4\u0dd6\u0dd8\u0df2\u0ddf\u0df3\u0dd9\u0dda\u0ddb\u0ddc\u0ddd\u0dde\u0dca")
}
stage {
# RULES # note[3] sub "\u0DCA", "ṅ", after: any("කඛගඝඞ") sub "\u0DCA", "ñ", after: any("චඡජඣඤ") sub "\u0DCA", "ṇ", after: any("ටඨඩඪණ") sub "\u0DCA", "n", after: any("තථදධන") # note[2(a,b)] sub "ක", "k", after: sinh_chars_1 sub "ඛ", "kh", after: sinh_chars_1 sub "ග", "g", after: sinh_chars_1 sub "ඝ", "gh", after: sinh_chars_1 sub "ඞ", "ṅ", after: sinh_chars_1 sub "ච", "c", after: sinh_chars_1 sub "ඡ", "ch", after: sinh_chars_1 sub "ජ", "j", after: sinh_chars_1 sub "ඣ", "jh", after: sinh_chars_1 sub "ඤ", "ñ", after: sinh_chars_1 sub "ට", "ṭ", after: sinh_chars_1 sub "ඨ", "ṭh", after: sinh_chars_1 sub "ඩ", "ḍ", after: sinh_chars_1 sub "ඪ", "ḍh", after: sinh_chars_1 sub "ණ", "ṇ", after: sinh_chars_1 sub "ත", "t", after: sinh_chars_1 sub "ථ", "th", after: sinh_chars_1 sub "ද", "d", after: sinh_chars_1 sub "ධ", "dh", after: sinh_chars_1 sub "න", "n", after: sinh_chars_1 sub "ප", "p", after: sinh_chars_1 sub "ඵ", "ph", after: sinh_chars_1 sub "බ", "b", after: sinh_chars_1 sub "භ", "bh", after: sinh_chars_1 sub "ම", "m", after: sinh_chars_1 sub "ය", "y", after: sinh_chars_1 sub "ර", "r", after: sinh_chars_1 sub "ල", "l", after: sinh_chars_1 sub "ළ", "ḷ", after: sinh_chars_1 sub "ව", "v", after: sinh_chars_1 sub "ශ", "ś", after: sinh_chars_1 sub "ෂ", "ṣ", after: sinh_chars_1 sub "ස", "s", after: sinh_chars_1 sub "හ", "h", after: sinh_chars_1 sub "ඟ", "ṅg", after: sinh_chars_1 sub "ඦ", "ñj", after: sinh_chars_1 sub "ඬ", "ṇḍ", after: sinh_chars_1 sub "ඳ", "nd", after: sinh_chars_1 sub "ඹ", "ṃb", after: sinh_chars_1 # CHARACTERS parallel { #Vowels and Diphthongs (see Note 1) sub "අ", "a" sub "ආ", "ā" sub "ඇ", "ă" sub "ඈ", "â" sub "ඉ", "i" sub "ඊ", "ī" sub "උ", "u" sub "ඌ", "ū" sub "ඍ", "ṛ" sub "ඎ", "ṝ" sub "ඏ", "ḷ" sub "ඐ", "ḹ" sub "එ", "e" sub "ඒ", "ē" sub "ඓ", "ai" sub "ඔ", "o" sub "ඕ", "ō" sub "ඖ", "au" sub "ා", "ā" sub "ැ", "ă" sub "ෑ", "â" sub "ි", "i" sub "ී", "ī" sub "ු", "u" sub "ූ", "ū" sub "ෘ", "ṛ" sub "ෲ", "ṝ" sub "ෟ", "ḷ" sub "ෳ", "ḹ" sub "ෙ", "e" sub "ේ", "ē" sub "ෛ", "ai" sub "ො", "o" sub "ෝ", "ō" sub "ෞ", "au" # II. Consonants (see Note 2) # Gutturals sub "ක", "ka" sub "ඛ", "kha" sub "ග", "ga" sub "ඝ", "gha" sub "ඞ", "ṅa" # Palatals sub "ච", "ca" sub "ඡ", "cha" sub "ජ", "ja" sub "ඣ", "jha" sub "ඤ", "ña" # Cerebrals sub "ට", "ṭa" sub "ඨ", "ṭha" sub "ඩ", "ḍa" sub "ඪ", "ḍha" sub "ණ", "ṇa" # Dentals sub "ත", "ta" sub "ථ", "tha" sub "ද", "da" sub "ධ", "dha" sub "න", "na" # Labials sub "ප", "pa" sub "ඵ", "pha" sub "බ", "ba" sub "භ", "bha" sub "ම", "ma" # Semivowels sub "ය", "ya" sub "ර", "ra" sub "ල", "la" sub "ළ", "ḷa" sub "ව", "va" # Sibilants sub "ශ", "śa" sub "ෂ", "ṣa" sub "ස", "sa" # Aspirate sub "හ", "ha" # Visarga sub "ඃ", "ḥ" # Anusvāra (see Note 3) sub "ං", "ṃ" # numbers sub "\u0DE6", "0" sub "\u0DE7", "1" sub "\u0DE8", "2" sub "\u0DE9", "3" sub "\u0DEA", "4" sub "\u0DEB", "5" sub "\u0DEC", "6" sub "\u0DED", "7" sub "\u0DEE", "8" sub "\u0DEF", "9" sub "", "" # Used for joining sub "", "" # Used for non joining sub "්", "" # Rule no 4 sub "ඟ", "ṅga" sub "ඦ", "ñja" sub "ඬ", "ṇḍa" sub "ඳ", "nda" sub "ඹ", "ṃba" } compose
}