metadata {

authority_id: alalc
id: 1997
language: iso-639-2:guj
source_script: Gujr
destination_script: Latn
name: Romanization Table -- Gujarati (1997)
url: http://catdir.loc.gov/catdir/cpso/romanization/gujarati.pdf
creation_date: 1997
description: |
  ALA-LC Romanization table for Gujarati

notes:

  - Only the vowel forms that appear at the beginning of a syllable are listed; the forms used for
    vowels following a consonant can be found in grammars; no distinction between the two is
    made in transliteration.

  - |
    The vowel a is implicit after all consonants and consonant clusters and is supplied in
    transliteration, with the following exceptions:
    a) when another vowel is indicated by its appropriate sign and
    b) when the absence of any vowel is indicated by the subscript symbol ( ્ ) called halanta or
    virāma.

  - |
    Exception: Anusvāra is transliterated by:
    a) ṅ before gutturals,
    b) ñ before palatals,
    c) ṇ before cerebrals,
    d) n before dentals, and
    e) m before labials.

  - When doubled, avagraha is transliterated by two apostrophes ( ’’ ).

}

tests {

test "અમિત શાહનો કોરોના રિપોર્ટ ૨ ઓગસ્ટે પોઝિટિવ આવ્યો હતો, ત્યારથી તેમનું સ્વાસ્થ્ય સારું નથી", "amita śāhanȏ kȏrȏnā ripȏrṭa 2 ȏgasṭȇ pȏjhiṭiva āvyȏ hatȏ, tyārathī tȇmanuṃ svāsthya sāruṃ nathī"
test "મેદાંતા હોસ્પિટલમાં તેમનો ઇલાજ ચાલી રહ્યો હતો", "mȇdāntā hȏspiṭalamāṃ tȇmanȏ ilāja cālī rahyȏ hatȏ"
test "ભારતના વિશ્વનાથન આનંદે શેનયાનમાં પહેલો ફિડે શતરંજ વિશ્વ કપ જીત્યો", "bhāratanā viśvanāthana ānandȇ śȇnayānamāṃ pahȇlȏ phiḍȇ śatarañja viśva kapa jītyȏ"
test "ભારતીય વડા પ્રધાન જવાહરલાલ નેહરુએ ૪૦ લાખ હિન્દુઓ અને મુસલમાનોના પારસ્પરિક સ્થાનાંતરણનું સૂચન આપ્યું", "bhāratīya vaḍā pradhāna javāharalāla nȇharuȇ 40 lākha hinduȏ anȇ musalamānȏnā pārasparika sthānāntaraṇanuṃ sūcana āpyuṃ"
test "લિબિયાના એલ અજિજિયામાં ધરતી પર સૌથી વધુ તાપમાન નોંધાયું. એ વખતે છાયામાં નોંધવામાં આવેલું તાપમાન ૫૮ ડિગ્રી સેલ્સિયસ હતું.", "libiyānā ȇla ajijiyāmāṃ dharatī para sauthī vadhu tāpamāna nȏndhāyuṃ. ȇ vakhatȇ chāyāmāṃ nȏndhavāmāṃ āvȇluṃ tāpamāna 58 ḍigrī sȇlsiyasa hatuṃ."
test "પ્રથમ વિશ્વયુદ્ધઃ જર્મની અને ફ્રાન્સ વચ્ચે એસ્નેની લડાઈ શરૂ થઈ હતી", "prathama viśvayuddhaḥ jarmanī anȇ phrānsa vaccȇ ȇsnȇnī laḍāī śarū thaī hatī"
test "એન્ગ્લો-મિસ્ત્ર યુદ્ધઃ તેલ અલ કેબિરનું યુદ્ધ લડવામાં આવ્યું હતું.", "ȇnglȏ-mistra yuddhaḥ tȇla ala kȇbiranuṃ yuddha laḍavāmāṃ āvyuṃ hatuṃ."
test "પુરાવા ન હતા, એ જ કારણે કેસ ચાલ્યો નહીં, પણ તેમને નજરકેદ રાખવામાં આવ્યા", "purāvā na hatā, ȇ ja kāraṇȇ kȇsa cālyȏ nahīṃ, paṇa tȇmanȇ najarakȇda rākhavāmāṃ āvyā"
test "સરદાર પટેલે નક્કી કર્યું હતું કે કાશ્મીર ભારતનો હિસ્સો બનશે; ૯૧ વર્ષ પહેલાં લાહોર જેલમાં ભૂખહડતાળ દરમિયાન શહીદ થયા હતા જતીન દાસ", "saradāra paṭȇlȇ nakkī karyuṃ hatuṃ kȇ kāśmīra bhāratanȏ hissȏ banaśȇ; 91 varsha pahȇlāṃ lāhȏra jȇlamāṃ bhūkhahaḍatāḷa daramiyāna śahīda thayā hatā jatīna dāsa"
test "કોરોના પ્રોટોકોલ વચ્ચે આજે મેડિકલ પ્રવેશ પરીક્ષા લેવાશેઃ એન્ટ્રી ટચ ફ્રી રહેશે, એડમિટ કાર્ડ બાર કોડથી ચેક થશે", "kȏrȏnā prȏṭȏkȏla vaccȇ ājȇ mȇḍikala pravȇśa parīkshā lȇvāśȇḥ ȇnṭrī ṭaca phrī rahȇśȇ, ȇḍamiṭa kārḍa bāra kȏḍathī cȇka thaśȇ"
test "અલ્ ક઼`ઇદ્ માં હવામાન", "al ka`id māṃ havāmāna"
test "મંત્રાલય તથા ખ઼.ય ના વિ૨ષ્ઠ અધિકા૨ીઓ ઉપસ્થિત ૨હ્યા હતા", "mantrālaya tathā kha.ya nā vi2shṭha adhikā2īȏ upasthita 2hyā hatā"

}

aliases {

def_alias characters_set1, any("\u0abe\u0abf\u0ac0\u0ac1\u0ac2\u0ac3\u0ac5\u0ac7\u0ac8\u0ac9\u0acb\u0acc\u0acd")

}

stage {

# RULES
# note 3
  sub "\u0A82", "ṅ", after: any("કખગઘઙ")
  sub "\u0A82", "ñ", after: any("ચછજઝઞ")
  sub "\u0A82", "ṇ", after: any("ટઠડઢણ")
  sub "\u0A82", "n", after: any("તથદધન")
  sub "\u0A82", "m", after: any("પફબભમ")

# note[2(a,b)]
  sub "ક", "k", after: characters_set1
  sub "ખ", "kh", after: characters_set1
  sub "ગ", "g", after: characters_set1
  sub "ઘ", "gh", after: characters_set1
  sub "ઙ", "ṅ", after: characters_set1
  sub "ચ", "c", after: characters_set1
  sub "છ", "ch", after: characters_set1
  sub "જ", "j", after: characters_set1
  sub "ઝ", "jh", after: characters_set1
  sub "ઞ", "ñ", after: characters_set1
  sub "ટ", "ṭ", after: characters_set1
  sub "ઠ", "ṭh", after: characters_set1
  sub "ડ", "ḍ", after: characters_set1
  sub "ઢ", "ḍh", after: characters_set1
  sub "ણ", "ṇ", after: characters_set1
  sub "ત", "t", after: characters_set1
  sub "થ", "th", after: characters_set1
  sub "દ", "d", after: characters_set1
  sub "ધ", "dh", after: characters_set1
  sub "ન", "n", after: characters_set1
  sub "પ", "p", after: characters_set1
  sub "ફ", "ph", after: characters_set1
  sub "બ", "b", after: characters_set1
  sub "ભ", "bh", after: characters_set1
  sub "મ", "m", after: characters_set1
  sub "ય", "y", after: characters_set1
  sub "ર", "r", after: characters_set1
  sub "લ", "l", after: characters_set1
  sub "ળ", "ḷ", after: characters_set1
  sub "વ", "v", after: characters_set1
  sub "શ", "ś", after: characters_set1
  sub "ષ", "sh", after: characters_set1
  sub "સ", "s", after: characters_set1
  sub "હ", "h", after: characters_set1

# CHARACTERS
parallel {

  sub "અ", "a"
  sub "આ", "ā"
  sub "ઇ", "i"
  sub "ઈ", "ī"
  sub "ઉ", "u"
  sub "ઊ", "ū"
  sub "ઋ", "ṛ"

  sub "ઍ", "e"
  sub "એ", "ȇ"
  sub "ઐ", "ai"

  sub "ઑ", "o"
  sub "ઓ", "ȏ"
  sub "ઔ", "au"

  # II. Consonants (see Note 2)
  # Gutturals
  sub "ક", "ka"
  sub "ખ", "kha"
  sub "ગ", "ga"
  sub "ઘ", "gha"
  sub "ઙ", "ṅa"

  # Palatals
  sub "ચ", "ca"
  sub "છ", "cha"
  sub "જ", "ja"
  sub "ઝ", "jha"
  sub "ઞ", "ña"

  # Cerebrals
  sub "ટ", "ṭa"
  sub "ઠ", "ṭha"
  sub "ડ", "ḍa"
  sub "ઢ", "ḍha"
  sub "ણ", "ṇa"

  # Dentals
  sub "ત", "ta"
  sub "થ", "tha"
  sub "દ", "da"
  sub "ધ", "dha"
  sub "ન", "na"

  # Labials
  sub "પ", "pa"
  sub "ફ", "pha"
  sub "બ", "ba"
  sub "ભ", "bha"
  sub "મ", "ma"

  # Semivowels
  sub "ય", "ya"
  sub "ર", "ra"
  sub "લ", "la"
  sub "ળ", "ḷa"
  sub "વ", "va"

  # Sibilants
  sub "શ", "śa"
  sub "ષ", "sha"
  sub "સ", "sa"

  # Aspirate
  sub "હ", "ha"

  # Bisarga
  sub "ઃ", "ḥ"

  # Anusvāra
  sub "ં", "ṃ"

  # Abagraha  (see Note 4)
  sub "ઽ", "’" # (apostrophe)

  # Medials # Needed for connecting constants

  sub "ા", "ā"
  sub "િ", "i"
  sub "ી", "ī"
  sub "ુ", "u"
  sub "ૂ", "ū"
  sub "ૃ", "ṛ"
  sub "ૅ", "e"
  sub "ે", "ȇ"
  sub "ૈ", "ai"
  sub "ૉ", "o"
  sub "ો", "ȏ"
  sub "ૌ", "au"

  # digits

  sub "૦", "0"
  sub "૧", "1"
  sub "૨", "2"
  sub "૩", "3"
  sub "૪", "4"
  sub "૫", "5"
  sub "૬", "6"
  sub "૭", "7"
  sub "૮", "8"
  sub "૯", "9"

  sub "્", ""
  sub "઼", ""
  sub "।", "."
  sub "\u09CD", "" # Used for joining
  sub "‍", "" # Used for joining
}

compose

}