ラテン文字と言えば英語、漢字と言えば中国語。別に間違いではありませんが、イコールではありません。文章を見て、特徴から何語で書かれているかを推測してみましょう。

※公開中ですがこの記事は未完成です。

ラテン文字+α

英語

英語であれば読めば分かると思います。

How are you?


スペイン語

最大の特徴は疑問形の¿?、感嘆符の¡!ではないでしょうか。ñ も一つの特徴ですね。英語の and に当たる y も特徴の一つです。

¿Cómo está usted?
¡Hola!


バスク語

バスク語も ñ を使いますが、スペイン語との見分けは簡単です。バスク語では ¿?, ¡! は使いません。

Wikipedia引用
Ingelesa Mendebaldeko germaniar hizkuntza da, Ingalaterran jatorriz duena eta mundu mailan lingua franca bilakatu dena.

バスク語の -ko は複数形なのでよく出てきます。また、コピュラと呼ばれる ... da なども特徴です。

Wikipedia引用
Mendiak mendia behar ez du, baina gizonak gizona bai.

-k もよく出てきます。否定に当たる ez も特徴です。ez に対して肯定は bai です。


ポーランド語

ポーランド語は意外と特徴が多いです。

Wikipedia引用
Język polski, polszczyzna – język lechicki z grupy zachodniosłowiańskiej (do której należą również czeski, kaszubski, słowacki i języki łużyckie), stanowiącej część rodziny indoeuropejskiej.


ポルトガル語

ポルトガル語では ¿?, ¡! は使いませんし、ã や ê などもスペイン語には見られません。

Wikipedia引用
Com a criação do Reino de Portugal em 1139 e a expansão para o sul na sequência da Reconquista, deu-se a difusão da língua pelas terras conquistadas e mais tarde, com as descobertas portuguesas, para o Brasil, África e outras partes do mundo.


フランス語

フランス語の特徴の1つとして、x'yyy といった形をよく取ることではないでしょうか。

Wikipedia引用
La France, en forme longue depuis 1875 la République française, est un État souverain transcontinental dont le territoire métropolitain est situé en Europe de l'Ouest et dont le territoire ultramarin est situé dans les océans Indien, Atlantique et Pacifique ainsi qu'en Amérique du Sud.


ドイツ語

ドイツ語と言えば ß ではないでしょうか。音は ss です。

Wikipedia引用
Außerdem ist Deutsch eine Minderheitensprache in einigen europäischen und außereuropäischen Ländern, z. B. in Rumänien und Südafrika sowie Nationalsprache im afrikanischen Namibia.


チェコ語

やたらと記号の多い言語です。記号が多いと言えばチェコ語かベトナム語くらいでしょう。

Wikipedia引用
Čeština neboli český jazyk je západoslovanský jazyk, nejbližší slovenštině, poté lužické srbštině a polštině.


ベトナム語

やたらと記号の多い言語です。記号が多く区切りが短かればベトナム語だと思われます。

Wikipedia引用
Tiếng Việt, cũng gọi là tiếng Việt Nam hay Việt ngữ là ngôn ngữ của người Việt và là ngôn ngữ chính thức tại Việt Nam. Đây là tiếng mẹ đẻ của khoảng 85% dân cư Việt Nam cùng với hơn 4 triệu Việt kiều.


チワン語

声調を単語ごとに表記し、末子音に見えなくもないので知らないと読めない言語かもしれません。

The Internationale Zhuang引用
hwnj daeuj gyoengq hoiq souh nit deng iek rauez hwnj daeuj gyoengq hoiq deng gaemh deng gvej raeuz.

単語末の z,j,x,q,h は声調表記であり読みません。
何も付けない:声調1、z:声調2、j:声調3、x:声調4、q:声調5、h:声調6 となっています。
旧表記があります。一般的ではありませんが現代でも使われます。

The Internationale Zhuang引用
hwnз daeuз gyoengƽ hoiƽ souƅ nit deng iek raueƨ hwnз daeuз gyoengƽ hoiƽ deng gaemƅ deng gveз raeuƨ.

こっちの方が読みやすいかもしれません。一見すると変な文字が使われていますが、よく見るとアラビア数字(2,3,4,5,6)です。


ハワイ語

ハワイ語ではハワイ語でしか使わない(多分)文字があります。ʻ がそうです。アポストロフィ (') みたいですがアポストロフィではありません。ただ、環境依存の関係で代用する例はあります。因みに読みとしては日本語の "っ" に近いです。ʻŌlelo Hawaiʻi だと "ッオーレロハヴァイッイ" もしくは "ッオーレロハワイッイ" となります。また、子音がやたらと少ないです。

ʻŌlelo Hawaiʻi

Wikipedia引用
ʻO Hawaiʻi (‘Ōlelo Pelekania: Hawaii, pukī.: Havaí, Havai, sepa.: Hawái) — ke one hānau o ka poʻe Hawaiʻi. He mokuʻāina ʻo ia o ʻAmelika Hui Pū ʻia, a he pae moku ʻo ia ma ka waena o ka Moana Pākīpika. Aia ʻo ia ma ke komohana hema o ʻAmelika Hui, ka hikina hema o Iāpana, a me ka hikina ʻākau o ʻAukekulelia.


マオリ語

ハワイ語同様、子音がやたらと少ないです。単語も短いです。

Wikipedia引用
Ko Hawai'i (Reo Pākeha: Hawaii, Reo Hawai'i: Hawaiʻi) ara "Ka Pae`aina o Hawai`i Loa" he kahui moutere e noho ana i Te Moana-nui-a-Kiwa. 1500 maero (2400 km) te roanga mai i te moutere o Hawai'i i te tonga tae noa ki te motuiti o Kure. Nō te 21 Here-turi-kōkā 1959 ka whakatūria a Hawaii hei te 50 o ngā wāhanga whenua o te Hononga-o-Amerika. E 3,700 km (2,300 maero) te tawhiti i te tuawhenua o Amerika.

Hawai'i のように借用語というか外来語?では ' を使いますが、これは英語等も同じで本来のマオリ語では使いません。


インドネシア語

インドネシア語と言えば、なんだか単語が長くて日本語みたいに母音がいつも付いてくる、といった感じでしょうか。

Wikipedia引用
Bahasa (dari bahasa Sanskerta भाषा, bhāṣā) adalah kemampuan yang dimiliki manusia untuk berkomunikasi dengan manusia lainnya menggunakan tanda, misalnya kata dan gerakan. Kajian ilmiah bahasa disebut ilmu linguistik.


バタク語

バタク語とは、単一の言語を指すわけではなく、言わばバタク諸語を指します。多分標準バタク語的なものはないです。ネット上の資料は、多分バタク・トバ語かバタク・マンダイリン語辺りです。

Wikipedia引用
Batak Toba i ma sada punguan marga sian halak Batak. Halak Batak Toba bahat maringanan di Kabupaten Toba, Kabupaten Tapanuli Utara, Kabupaten Humbang Hasundutan, Kabupaten Samosir dohot Kabupaten Tapanuli Tonga.


アチェ語

---

---


ジャワ語

ジャワ語にはインドネシア語にない th, dh などの音があります。

---


ズールー語

ズールー語の特徴ではなく、バントゥー諸語の特徴ですが、固有名詞の前に接頭辞を色々とくっつけて、固有名詞部分は大文字で書くという分かりやすい特徴があります。

isiZulu

isi と Zulu の間はスペースがありません。

Wikipedia引用
Uyamukelwa kwiWikipedia yesiZulu


グリーンランド語

グリーンランド語と言えば、何と言っても単語の長さじゃないでしょうか。勿論長いのにも理由があって、日本語やドイツ語のように単語にそのまま色々くっつけるからです。

Wikipedia引用
Encyklopædi ammasoq killeqanngitsorlu kikkulluunniit piumasut aaqqissorsinnaasaat.


アゼルバイジャン語

アゼルバイジャン語といえば、ə が分かりやすいのではないでしょうか。意外と使われない文字です。

---




キリル文字+α

ロシア語

---

---


ウクライナ語

ウクライナ語では、ロシア語では使わないラテン文字の i のような文字を使います。

---


カザフ語

カザフ語では、ロシア語では使わない Ғ Қ Ң Ө などを使います。

---


モンゴル語

モンゴル語では、ロシア語では使わない Ө を使います。カザフ語にある Ғ Қ Ң は使いません。また、モンゴル語は母音をよく重ねます。

---


アブハズ語

---

---




アラビア文字+α

アラビア語

---

---


ウルドゥー語

ウルドゥー語はナスタアリーク体と呼ばれる字体で表記されますが、ネット上ではアラビア語等と同じ書体も使われます。その際の見分けとしては、ウルドゥー語で使われる文字があります。

Wikipedia引用
اُردُو (یا جدید معیاری اردو) یا لشکری زبان برصغیر کی معیاری زبانوں میں سے ایک ہے۔ یہ پاکستان کی قومی اور رابطہ عامہ کی زبان ہے، جبکہ بھارت کی چھے ریاستوں کی دفتری زبان کا درجہ رکھتی ہے۔

結合文字の都合上赤くしませんが、Cのように下に曲げる文字の ے が特徴です。音としては e の母音です。e の近くに付いている ، みたいなやつも特徴です。これは発音記号とかではなく、子音の一部です。 ہے は he と読みます。

ナスタアリーク体(画像)

Noto Nastaliq Urdu


ペルシア語

ペルシア語もウルドゥー語同様ナスタアリーク体を使います。

---


ウイグル語

現代のウイグル語はアラビア文字ですが母音を明確に表記します。

---


ロヒンギャ語

ロヒンギャ語はロヒンギャ文字もありますがアラビア文字表記もします。

---


ヘブライ語

---

---


ディベヒ語

ディベヒ語ではターナ文字というアラビア文字のような何かを使います。

---




漢字+α

中国語(北京語, 官話)

漢字のみの表記であれば中国語の可能性がある程度は高いです。簡体字であれば標準中国語の可能性が高いです。繁体字であれば、台湾華語、広東語など候補が増えてきます。

---


偽中国語

これは読めば分かります。以下例文。

ニコニコ大百科引用
漢字移入自中国至日本。故漢字文化圏在住者、外国人表記的漢字大体理解。

これは日本語です。


広東語(粤語)

音があれば一発で分かるのですが、漢字表記のみだと断定は難しいかもです。

---

音声もしくは音の表記ありの場合、標準中国語と比べて以下の例が挙げられます。
表記標準中国語広東語
wongo
你好ni-haonei-hou
日本人ri-ben-renyat-bun-yan

用いる漢字が違う例
標準中国語広東語
是 shi係 hai
他 ta佢 keui
我们 / 我們 wo-men我哋 ngo-dei


上海語(呉語)

広東語同様、音が分からなければ見分けは難しいかもです。

---


湘語

多分、湘語で書かれたコンテンツは少ないです。

---


赣語

多分、赣語で書かれたコンテンツは少ないです。

---


客家語

客家語は漢字表記が可能ですが、 Hak-kâ-ngî のようにラテン文字を用いて表記するのが普通です。

---


台湾語(閩南語, 閩語)

台湾語は閩南語の一種であり、標準中国語や台湾華語は北京語もどきなので、意思疎通は出来ないと思われます。福建語と呼ばれることもありますが、福建語は閩南語、もしくは閩語のことです。
台湾華語(國語)と台湾語は別物です。台湾華語は台湾の公用語である中国語を指します。台湾華語と標準中国語はイコールではなく、語彙の違いが見られますが、意思疎通は問題ないと思われます。

---


ベトナム語

ベトナムも漢字文化圏なので、ベトナム語を漢字表記可能です。ただし、正確には漢字ではなくチュノム(𡨸喃 / Chữ Nôm)と呼ばれる文字となります。

韋那威箕引用
㗂越 (𡨸國語: Tiếng Việt)、群噲㗂越南咍越語、羅言語𧵑𠊛越(𠊛京)吧羅言語正式在越南。

画像版

Han-Nom Gothic

見ての通り、基本的に漢字をそのまま使います。そこに独自の文字が混ざる形となります。独自の文字ですがチュノムはUnicodeでは漢字扱いであり、チュノム対応漢字フォントで表示可能です。繁體中国語にも見えなくもないですが、よく見ると中国語だとしても見慣れない漢字が混ざっています。


チワン語

チワン語では古壮字と呼ばれるベトナム語で言うチュノムと同じような文字があります。

The Internationale Zhuang引用
很僦,衆仡受󶄵丁哟仅。很僦,衆仡丁擒丁𧊅仅。

画像版

BabelStone Han + Sawndip

こちらも漢字扱いです。古壮字は対応フォントが少ないです。チワン語はベトナム語と違い、簡体字のような文字も使います。簡体字を使うのにどうみても簡体字じゃない文字が混ざっています。古壮字という名前の通り、現代チワンでは古壮字は一般的ではありません。現代チワン語はラテン文字で書かれます。


西夏語

西夏語は漢字派生の文字を使いますが、全く違う文字ですので見れば分かります。

Wikisource引用
𗥦𗰞𗱸𗍁𗛹𗋽𗎘, 𘅞𘔚𗔀𗹸𗲌𗴂𗹭, 𗼎𗾧𘕿𗗙𗂧𗋕𗁁.
𘈑𗧁𗹭𗰗𗁞𘓐, 𘆽𘛽𘄽𗏁𘄷𘁿, 𗤳𗑝𗶚𗈪𘀟𘈷.

画像版

Noto Serif Tangut

契丹語

契丹語では漢字とよく似た契丹文字を使います。以下は契丹小字と呼ばれるものです。

※BabelStone 配布の Khitan Small Script Fonts を想定しています。

契丹小字七言絶句銅鏡引用 [Chrome系用]
𘭔𖿤𘭢 𘲽𘱸
𘰷𘭴 𘰝𘲚𘲦 𘲲𘯴𘱆 𘳍𘰄 𘰴𘳍𘰄
𘬜𘭞𘰷 𘬜𘭞𘰷 𘲀𘭞𘭟 𘲀𘭞𘭟 𘱓𘮯𘮡
𘬹𘯺𘮢 𘬥𘳍𘰄 𘲽𘲜 𘲫𘱮 𘮡𘱆
𘰺𘰂𘮅𘲚𘲴 𘬥𘱛 𘰭𘲣𘰥 𘭐𘰱 𘰺𘯜𘯺
𘮠𖿤𘱤 𘰺𘮢𘲆𘭢 𘯺𘮅𘭂𘯢 𘲜𘱤𘬚
𘰭𘱀 𘬜𘳍𘰄

契丹小字七言絶句銅鏡引用 [Firefox用]
𘭔𖿤𘭢 𘲽𘱸
𘰷𘭴 𘰝𘲚𘲦 𘲲𘯴𘱆 𘳍𘰄 𘰴𘳍𘰄
𘬜𘭞𘰷 𘬜𘭞𘰷 𘲀𘭞𘭟 𘲀𘭞𘭟 𘱓𘮯𘮡
𘬹𘯺𘮢 𘬥𘳍𘰄 𘲽𘲜 𘲫𘱮 𘮡𘱆
𘰺𘰂𘮅𘲚𘲴 𘬥𘱛 𘰭𘲣𘰥 𘭐𘰱 𘰺𘯜𘯺
𘮠𖿤𘱤 𘰺𘮢𘲆𘭢 𘯺𘮅𘭂𘯢 𘲜𘱤𘬚
𘰭𘱀 𘬜𘳍𘰄

画像版

Khitan Small Rotated

女真語

女真語では漢字とよく似た女真文字を使います。女真文字は2021年11月現在フォントが存在しません。

---


韓国語(朝鮮語)

ハングルであれば韓国語。まあ、高確率でそうですが、100%ではありません。

---


済州語

ハングルを使う別言語として、韓国南部の島、済州島で使われる済州語があります。韓国語では使わないが済州語では使われる文字があります。

Wikipedia引用
위키벡과는 오곤 천지 ᄋᆢ라 말덜로 페웡 나가는 ᄌᆞ유 벡과ᄉᆞ전인디, 아미영ᄒᆞᆫ 사름도 ᄒᆞᆫ디 들어져마씸.

画像版

Noto Sans KR

ㆍ がそうです。古ハングルと呼ばれているものの1つになります。


女書

女書は特徴が大きいので見れば分かります。

𛆁𛈬


画像版

Noto Sans Nushu



モンゴル文字+α

モンゴル語

まずはモンゴル語の例文を見てみましょう。

Wikipedia引用
ᠸᠢᠺᠢᠫᠧᠳᠢᠶ᠎ᠠ᠂
ᠴᠢᠯᠦᠭᠡᠲᠦ
ᠨᠡᠪᠲᠡᠷᠬᠡᠢ
ᠲᠣᠯᠢ
ᠪᠢᠴᠢᠭ
ᠪᠣᠯᠠᠢ᠃

画像版

Noto Sans Mongolian


満州語

次は満州語です。

Wikipedia引用
ᡥᠠᠨ ᡳ
ᠠᡵᠠᡥᠠ
ᠰᡠᠨᠵᠠ
ᡥᠠᠴᡳᠨ ᡳ
ᡥᡝᡵᡤᡝᠨ
ᡴᠠᠮᠴᡳᡥᠠ
ᠮᠠᠨᠵᡠ
ᡤᡳᠰᡠᠨ ᡳ
ᠪᡠᠯᡝᡴᡠ
ᠪᡳᡨᡥᡝ

画像版

Noto Sans Mongolian

察しのいい人はもう気づいたのではないでしょうか。満州語では文字の右に丸がよく付きます。文字の右に丸が付くと満州語などの可能性が高くなります。ただし、絶対ではありません。モンゴル語では用いない文字なので、モンゴル語ではないのは予測可能です。


オイラト語

オイラト語はモンゴル語と比べると、やたらと閉じる事が多いです。オイラト語にはオイラト語で用いる文字があります。

ᡐᡆᡑᡆ
ᡋᡅᡒ‍ᡅᡎ

画像版

Noto Sans Mongolian

オイラト語でオイラト文字(トド文字)と書くとこうなります。これだけだと特徴が大きいですね。


シベ語

シベ語は一番独自の特徴がなく、別の言語に見えてしまうかもしれません。シベ語も満州語等と同様、右に丸が付くため、モンゴル語ではない判別は可能です。

ᠰᡞᠪᡝ
ᡤᡞᠰᡠᠨ

画像版

Noto Sans Mongolian


ブリヤート語

現代のブリヤート語はキリル文字が使われます。

ᠪᠤᠷᠢᠶᠠᠳ
ᠬᠡᠯᠡᠨ

画像版

Noto Sans Mongolian

Буряад хэлэн


ウイグル語

ウイグル語に関しては、ウイグル語は普通、ネット上ではウイグル文字フォントを用いたコンテンツは皆無と思われます。資料としてはありますが。ウイグル文字は Unicode 14.0 で追加されたため、ウイグル文字フォントを用いたコンテンツが今後出てくる可能性はあります。現代のウイグル語はアラビア文字が使われます。

* フォントが存在しない為コードが合ってるか不明。
𐽴𐽲𐽶𐽴𐽿

ئۇيغۇرچە




デーヴァナーガリー+α

ヒンディー語

---

---


ネパール語

母音削除の ् はヒンディー語では普通使わず、ネパール語やサンスクリット語で使います。

---


サンスクリット語

母音削除の ् や、サンスクリット語特有(多分)の ः が特徴です。

---


ベンガル語

ベンガル文字は、デーヴァナーガリーとよく似ていますが少し違います。ক や ব など、ベンガル文字は三角を作りますが、デーヴァナーガリーは作りません。

---


グジャラート語

グジャラート文字は、デーヴァナーガリーの上の棒を取ったような見た目をしています。

---




タイ文字+α

タイ語

---

---


ラオ語

---

---


クメール語

---

---


黒タイ語

---

---




ビルマ文字+α

ミャンマー語

母音記号を除いてすべての文字が丸いのが特徴です。

Wikipedia引用
မြန်မာဘာသာစကားသည် မြန်မာနိုင်ငံ၏ ရုံးသုံး ဘာသာစကားဖြစ်သည်။ ဗမာလူမျိုးနှင့် ဗမာနွယ်ဝင်(ဓနု၊ အင်းသား၊ တောင်ရိုးနှင့် ယော)တို့၏ ဇာတိစကားဖြစ်သည်။


シャン語

ミャンマーやタイに住むシャン族のシャン語では似た文字を使います。

Wikipedia引用
ShanManၵ်ႈတႆး (IPA: /lik táj/) ဢၼ်မၵ်းမၼ်ႈၸႂ်ႉတိုဝ်းဝႆႉ ၵၢပ်ႈယၢမ်းလဵဝ်ၼႆႉပဵၼ် လိၵ်ႈတႆး'မ'ႁႃႈတူဝ် ၼႆယဝ်ႉ။ ပဵၼ်လိၵ်ႈလၢႆးငဝ်ႈၶွင်ၸၢဝ်းၶိူဝ်းတႆးသေ ၵမ်ႈၼမ်ၼမ် ၵူၼ်းၸႂ်ႉတိုဝ်းမၼ်း မီးၼႂ်းၸိုင်ႈတႆး၊ မိူင်းမၢၼ်ႊၼၼ်ႉယဝ်ႉ။

ミャンマー語で使われる文字を覚えれば、使われる文字が結構違うので見分けられるようになるかと思います。

タイ・ルー語

タイ・ルー語では、タイ・ロ文字とラーンナー文字の2種類が使われます。まずはタイ・ロ文字の例です。

Wikipedia引用
ᦉᦩᦃᦩᦓุᦂᦃᦙᦀᦸᦉᦃีᦏี่ᦏุᦂᦥᦓแᦂ้ᦀᦱᦖᦀᦱᦡ้ ᦞิᦂิᦘีᦀᦸᦡีᦊᦅᦩᦉᦩᦀᦱᦏᦊᦙี 13 ᦢᦏᦥᦞᦩᦙ

次にラーンナー文字表記の例です。タイ・ロ文字と似ていますが、タイ・ロ文字と違いラーンナー文字は重ねる(例:ᨠ᩠ᨡ)ことができます。

อักขระ ชนชาติไตย引用
ᩋᨠ᩠ᨡᩁᨽᩣᩈᩣᨲ᩠ᩅ ᩫᨴᩱᩭ ᩋᨠ᩠ᨡᩁᨧᩨᨧᩣᩴᩁᩭᩁᩅᩱᩢᩭ ᩋᨠ᩠ᨡᩁᩃ᩠ᨠᩥᨲ᩠ᩅᩫᨩᩣ᩠ᩅᨴᩱᩭ ᩋᨠ᩠ᨡᩁᨺᩣ᩠ᨠᨸᩢ᩠ᨶᩁᨩᩣ᩠ᩅᨴᩱᩭ

またこの文字は北タイ語、タイ・キュン語でも使われます。

タイ・ナ語

こちらは他と違い直線が出てきます。

ᥖᥭᥰᥖᥬᥲᥑᥨᥒᥰ




チベット文字+α

チベット語

チベット文字であれば、チベット語である可能性がある程度高いです。

བཀྲིས་བདེ་ལེགས།


ゾンカ

ブータンの公用語であるゾンカもチベット文字で書きます。多分、チベット語の次に可能性としては高いです。

---

---

シェルパ語

ཌ་ はチベット語では使いません(借用語や用語を除く)。

---


ラダック語

---

---


バルティ語

ཫ་ཬ་ཁ༹་ག༹་ の4文字はバルティ語で使われます。

---


モンゴル語

モンゴル語はパスパ文字でも表記可能です。

ꡏꡡꡃ
ꡣꡡꡙ
ꡐꡜꡞ

画像版

Noto Sans PhagsPa

パスパ文字はチベット文字派生の文字です。




その他ブラーフミー系

ジャワ語

---

ꦄꦏ꧀ꦱꦫ​ꦗꦮ


バリ語

バリ文字はジャワ文字とよく似ています。

ᬅᬓ᭄ᬱᬭᬩᬮᬶ


チャム語

文字としては独特なので分かりやすいです。

ꨀꨇꩉ ꨌꩌ


バタク語

バタク文字

---


スンダ語

スンダ文字

---


ブギス語

ブギス文字

---




その他(ユーラシア)

アルメニア語

---

---


ジョージア語

---

---


カフカス・アルバニア語

アルメニア文字、ジョージア文字の仲間としてカフカス・アルバニア文字というものがあります。

𐔰𐔾𐔱𐔰𐕎𐔼𐔰

画像版

Noto Sans Caucasian Albanian

Albania を転写したものです。カフカス・アルバニア語の情報が無くサンプルが用意できませんでした。


ハンガリー語

ハンガリー語はロヴァーシュ文字という文字も使います。

---




その他(アフリカ)

アムハラ語

---

---


ベルベル語

---

---


メンデ語

---

---




その他

---語

---

---