Модул:Уницоде дата/сцриптс/док

Ово је документациона подстраница за Модул:Unicode data/scripts

Тхис модуле wас генератед бy а сериес оф фунцтионс ин Модуле:Усер:Ерутуон/сцрипт рецогнитион фром тхе сцрипт паттернс ин Модуле:сцриптс/дата. Ит ис усед бy тхе цхар_то_сцрипт фунцтион ин Модуле:Уницоде дата. Ит wилл хаве то бе регенератед wхен сцрипт паттернс аре аддед ор модифиед.

Тхе хигхлигхт_думп анд модифиед_думп фунцтионс ин Модуле:дебуг wере усед то принт тхе оутпут фром Модуле:Усер:Ерутуон/сцрипт рецогнитион.

То еxплаин тхе формат, тхе фирст кеyс аре тхе гроупс оф 4096 цодепоинтс (0x1000 ин хеxадецимал басе). Кеy 0 ис фор тхе фирст гроуп оф 4096 цодепоинтс, фром У+000 то У+ФФФ. Wитхин тхе таблес фор еацх блоцк оф цодепоинтс, тхе сyнтаx { 0x41, 0x5А, "Латн" } индицатес тхат алл тхе цхарацтерс фром цодепоинт 0x41 (У+0041 ор тхе цхарацтер А) то цодепоинт 0x5А (У+005А ор тхе цхарацтер З) белонг то тхе Латин сцрипт. Тхе табле "индивидуал" цонтаинс алл тхе индивидуал цодепоинтс тхат аре дефинед ас белонгинг то а сцрипт, бут аре нот фоунд инсиде а ранге.

Беwаре: деспите беинг листед ундер Модуле:Уницоде дата, тхис wас генератед фром Wиктионарy сцрипт цлассес. Фор тхе оффициал сцрипт пропертиес оф Уницоде цодепоинтс, го то Модуле:Лангуаге/сцриптс/цодепоинтс, Модуле:Лангуаге/сцриптс/цодепоинтс вербатим, анд Модуле:Лангуаге/сцриптс/цодепоинтс адјацент мергед он Wикипедиа.

Цонфлицтс бетwеен цхарацтер сетс оф дифферент сцриптс

уреди

Тхис модуле инцлудес феwер сцриптс тхан Модуле:сцриптс/дата, бецаусе соме сцриптс до нот хаве цхарацтерс ат алл, анд соме сцриптс' цхарацтер сетс аре ин цонфлицт wитх еацх отхер. Хере аре тхе wаyс цонфлицтс хаве беен ресолвед.

Сцриптс аре омиттед иф тхеy хаве тхе саме цхарацтерс ас анотхер море басиц сцрипт, ор тхеy цонсист оф тwо ор море отхер сцриптс. Фор еxампле, fa-Arab ис омиттед бецаусе ит цонтаинс тхе саме цхарацтерс ас Arab, анд Jpan ис омиттед бецаусе ит цонсистс оф Hani, Hira анд Kana.

Иф а сцрипт цонсистс оф тхе цхарацтерс оф анотхер сцрипт, плус соме униqуе цхарацтерс, онлy тхе униqуе цхарацтерс аре цоунтед ас белонгинг то тхе сцрипт. Фор инстанце, polytonic цонсистс оф тхе цхарацтерс оф Grek, wхицх аре усед ин тхе монотониц ортхограпхy оф Модерн Греек, плус цхарацтерс усед фор Анциент Греек; онлy тхе Анциент Греек цхарацтерс аре цоунтед ас polytonic ин тхис модуле. Ит ис тхе саме wитх Cyrs анд Cyrl, Latinx анд Latn.