metadata {

authority_id: alalc
id: 1997
language: iso-639-2:sin
source_script: Sinh
destination_script: Latn
name: Romanization Table -- Sinhalese (1997)
url: http://catdir.loc.gov/catdir/cpso/romanization/sinhales.pdf
creation_date: 1997
description: |
  ALA-LC Romanization table for Sinhalese

notes:

  - Only the vowel forms that appear at the beginning of a syllable are listed; the forms used for
    vowels following a consonant can be found in grammars; no distinction between the two is
    made in transliteration.

  - |
    The vowel a is implicit after all consonants and consonant clusters and is supplied in
    transliteration, with the following exceptions:

    a) when another vowel is indicated by its appropriate sign; and
    b) when the absence of any vowel is indicated by the sign ් called virāma.

  - |
    Exceptions: Anusvāra is transliterated by:

    a) ṅ before gutturals,
    b) ñ before palatals,
    c) ṇ before cerebrals,
    d) n before dentals, and
    e) m before labials.

  - |
    Exceptions:
    a) when saññaka represents a nasal, it is romanized according to the rule for anusvāra.
    b) when saññaka is combined with an aspirated consonant, the combination is romanized as a non-aspirated, followed by an aspirated consonant.

}

tests {

test "ශී‍්‍ර ලංකාවේ කී‍්‍රඩාව ඉතිහාසයේ ඉහළම තැනකට ගේන්න කටයුතු කරනවා", "śīra laṃkāvē kīraḍāva itihāsayē ihaḷama tănakaṭa gēnanna kaṭayutu karanavā"
test "කොච්චිකඬේ මෝයකට අසල නෑමට ගිය තරුණයෝ ෩ක් මරුට - මිතුරාගේ උපන් දිනය සැමරීමට ඇවිත්", "kocañcikaṇḍē mōyakaṭa asala nâmaṭa giya taruṇayō 3k maruṭa - miturāgē upan dinaya sămarīmaṭa ăvit"
test "ලෝක ළමා දිනයදා සිසුන් පිරිසක් කසිප්පු බීලා", "lōka ḷamā dinayadā sisun pirisak kasippu bīlā"
test "කෝටි 16ක හෙරොයින් සමග දන්කොටුවේදී 7ක් දැලේ", "kōṭi 16ka heroyin samaga danaṅkoṭuvēdī 7k dălē"
test "මිනුවන්ගොඩ පීසීආර් දෙදහසක් සිදුකරයි", "minuvanaṅgoḍa pīsīār dedahasak sidukarayi"
test "පාස්කු ප‍්‍රහාරය වගේම පාස්කු ප්‍රෝඩාව ගැනත් සොයන්න කොමිසමක් පත්කළ යුතුයි - විපක්‍ෂ නායක සජිත් පේ‍්‍රමදාස", "pāsaṅku parahāraya vagēma pāsaṅku prōḍāva gănat soyananna komisamak pataṅkaḷa yutuyi - vipakṣa nāyaka sajit pēramadāsa"
test "ට‍්‍රම්ප්ගේ සෞඛ්‍යය තීරණාත්මකයි - ට්විටර් හරහා ජනතාව අමතයි", "ṭarampaṅgē saukhyaya tīraṇātmakayi - ṭviṭar harahā janatāva amatayi"
test "පාස්කු දා ප‍්‍රහාරය පිළිබඳ පරීක්‍ෂණවලින් කිසිවකුට අසාධාරණයක් වීමට ඉඩ දෙන්නේ නෑ - අගමැති", "pāsaṅku dā parahāraya piḷibanda parīkṣaṇavalin kisivakuṭa asādhāraṇayak vīmaṭa iḍa denannē nâ - agamăti"
test "දිල්ලි කැපිටල්ස් සහ කෝලිගේ බැංගලෝර් තෙවැනි ජය ලබයි", "dilli kăpiṭals saha kōligē băṃgalōr tevăni jaya labayi"
test "ශ‍්‍රී ලාංකික සම්භවයක් සහිත ප‍්‍රංශයේ පවුලක 5 ක් ඝාතනය කරලා", "śarī lāṃkika sambhavayak sahita paraṃśayē pavulaka 5 k ghātanaya karalā"
test "පැතිකුදය ඉක්මනින් සුව කරන ප‍්‍රතිකාර", "pătikudaya ikmanin suva karana paratikāra"

}

aliases {

def_alias sinh_chars_1, any("\u0dcf\u0dd0\u0dd1\u0dd2\u0dd3\u0dd4\u0dd6\u0dd8\u0df2\u0ddf\u0df3\u0dd9\u0dda\u0ddb\u0ddc\u0ddd\u0dde\u0dca")

}

stage {

# RULES
# note[3]
  sub "\u0DCA", "ṅ", after: any("කඛගඝඞ")
  sub "\u0DCA", "ñ", after: any("චඡජඣඤ")
  sub "\u0DCA", "ṇ", after: any("ටඨඩඪණ")
  sub "\u0DCA", "n", after: any("තථදධන")

# note[2(a,b)]
  sub "ක", "k", after: sinh_chars_1
  sub "ඛ", "kh", after: sinh_chars_1
  sub "ග", "g", after: sinh_chars_1
  sub "ඝ", "gh", after: sinh_chars_1
  sub "ඞ", "ṅ", after: sinh_chars_1
  sub "ච", "c", after: sinh_chars_1
  sub "ඡ", "ch", after: sinh_chars_1
  sub "ජ", "j", after: sinh_chars_1
  sub "ඣ", "jh", after: sinh_chars_1
  sub "ඤ", "ñ", after: sinh_chars_1
  sub "ට", "ṭ", after: sinh_chars_1
  sub "ඨ", "ṭh", after: sinh_chars_1
  sub "ඩ", "ḍ", after: sinh_chars_1
  sub "ඪ", "ḍh", after: sinh_chars_1
  sub "ණ", "ṇ", after: sinh_chars_1
  sub "ත", "t", after: sinh_chars_1
  sub "ථ", "th", after: sinh_chars_1
  sub "ද", "d", after: sinh_chars_1
  sub "ධ", "dh", after: sinh_chars_1
  sub "න", "n", after: sinh_chars_1
  sub "ප", "p", after: sinh_chars_1
  sub "ඵ", "ph", after: sinh_chars_1
  sub "බ", "b", after: sinh_chars_1
  sub "භ", "bh", after: sinh_chars_1
  sub "ම", "m", after: sinh_chars_1
  sub "ය", "y", after: sinh_chars_1
  sub "ර", "r", after: sinh_chars_1
  sub "ල", "l", after: sinh_chars_1
  sub "ළ", "ḷ", after: sinh_chars_1
  sub "ව", "v", after: sinh_chars_1
  sub "ශ", "ś", after: sinh_chars_1
  sub "ෂ", "ṣ", after: sinh_chars_1
  sub "ස", "s", after: sinh_chars_1
  sub "හ", "h", after: sinh_chars_1
  sub "ඟ", "ṅg", after: sinh_chars_1
  sub "ඦ", "ñj", after: sinh_chars_1
  sub "ඬ", "ṇḍ", after: sinh_chars_1
  sub "ඳ", "nd", after: sinh_chars_1
  sub "ඹ", "ṃb", after: sinh_chars_1

# CHARACTERS
parallel {

  #Vowels and Diphthongs (see Note 1)

  sub "අ", "a"
  sub "ආ", "ā"
  sub "ඇ", "ă"
  sub "ඈ", "â"
  sub "ඉ", "i"
  sub "ඊ", "ī"
  sub "උ", "u"
  sub "ඌ", "ū"
  sub "ඍ", "ṛ"
  sub "ඎ", "ṝ"
  sub "ඏ", "ḷ"
  sub "ඐ", "ḹ"
  sub "එ", "e"
  sub "ඒ", "ē"
  sub "ඓ", "ai"
  sub "ඔ", "o"
  sub "ඕ", "ō"
  sub "ඖ", "au"

  sub "ා", "ā"
  sub "ැ", "ă"
  sub "ෑ", "â"
  sub "ි", "i"
  sub "ී", "ī"
  sub "ු", "u"
  sub "ූ", "ū"
  sub "ෘ", "ṛ"
  sub "ෲ", "ṝ"
  sub "ෟ", "ḷ"
  sub "ෳ", "ḹ"
  sub "ෙ", "e"
  sub "ේ", "ē"
  sub "ෛ", "ai"
  sub "ො", "o"
  sub "ෝ", "ō"
  sub "ෞ", "au"

  # II. Consonants (see Note 2)
  # Gutturals
  sub "ක", "ka"
  sub "ඛ", "kha"
  sub "ග", "ga"
  sub "ඝ", "gha"
  sub "ඞ", "ṅa"

  # Palatals
  sub "ච", "ca"
  sub "ඡ", "cha"
  sub "ජ", "ja"
  sub "ඣ", "jha"
  sub "ඤ", "ña"

  # Cerebrals
  sub "ට", "ṭa"
  sub "ඨ", "ṭha"
  sub "ඩ", "ḍa"
  sub "ඪ", "ḍha"
  sub "ණ", "ṇa"

  # Dentals
  sub "ත", "ta"
  sub "ථ", "tha"
  sub "ද", "da"
  sub "ධ", "dha"
  sub "න", "na"

  # Labials
  sub "ප", "pa"
  sub "ඵ", "pha"
  sub "බ", "ba"
  sub "භ", "bha"
  sub "ම", "ma"

  # Semivowels
  sub "ය", "ya"
  sub "ර", "ra"
  sub "ල", "la"
  sub "ළ", "ḷa"
  sub "ව", "va"

  # Sibilants
  sub "ශ", "śa"
  sub "ෂ", "ṣa"
  sub "ස", "sa"

  # Aspirate
  sub "හ", "ha"

  # Visarga
  sub "ඃ", "ḥ"

  # Anusvāra (see Note 3)
  sub "ං", "ṃ"

  # numbers
  sub "\u0DE6", "0"
  sub "\u0DE7", "1"
  sub "\u0DE8", "2"
  sub "\u0DE9", "3"
  sub "\u0DEA", "4"
  sub "\u0DEB", "5"
  sub "\u0DEC", "6"
  sub "\u0DED", "7"
  sub "\u0DEE", "8"
  sub "\u0DEF", "9"

  sub "‍", "" # Used for joining
  sub "‌", "" # Used for non joining
  sub "්", ""

  # Rule no 4
  sub "ඟ", "ṅga"
  sub "ඦ", "ñja"
  sub "ඬ", "ṇḍa"
  sub "ඳ", "nda"
  sub "ඹ", "ṃba"
}

compose

}