Azərbaycanca  AzərbaycancaБеларуская  БеларускаяDeutsch  DeutschEnglish  EnglishFrançais  FrançaisҚазақ  ҚазақLietuvių  LietuviųРусский  Русскийภาษาไทย  ภาษาไทยTürkçe  TürkçeУкраїнська  Українська
Падтрымка
www.global-by3.nina.az
  • Галоўная
  • Вікіпедыя
  • Музыка

У гэтай старонкі няма правераных версій хутчэй за ўсё яе якасць не ацэньвалася на адпаведнасць стандартам Уніко д англ U

Юнікод

  • Галоўная старонка
  • Вікіпедыя
  • Юнікод
У гэтай старонкі няма правераных версій, хутчэй за ўсё, яе якасць не ацэньвалася на адпаведнасць стандартам.

Уніко́д (англ.: Unicode вымаўляецца як Юніко́д; скарачэнне ад Універса́льны код) — стандарт кадзіравання сімвалаў, які дазваляе адлюстраваць літары і знакі амаль усіх пісьмовых моў.

Стандарт быў прапанован у 1991 годзе некамерцыйнай арганізацыяй «» (англ.: Unicode Consortium, Unicode Inc.). Выкарыстанне гэтага стандарту дазваляе надаць коды вельмі вялікай колькасці сімвалаў з розных сістэм пісьма: у дакументах з выкарыстаннем Унікоду могуць разам выкарыстоўвацца кітайскія іерогліфы, матэматычныя сімвалы, літары грэчаскага алфавіта, лацінкі і кірыліцы, а патрэба ў пераключэнні адпадае.

Стандарт складаецца з двух асноўных раздзелаў: універсальны набор сімвалаў (англ.: UCS, universal character set) і сямейства кадзіровак (па-англійску: UTF, Unicode transformation format). Універсальны набор сімвалаў вызначае дакладную адпаведнасць сімвалаў кодам — элементам кодавай прасторы, якія ёсць неадмоўнымі цэлымі лікамі. Сямейства кадзіровак вызначае машынны запіс паслядоўнасці кодаў UCS.

Коды ў стандарце Унікод раздзелены на некалькі частак. Частка з кодамі ад U+0000 да U+007F утрымлівае сімвалы з набору ASCII з адпаведнымі кодамі. Далей размешчаны часткі сімвалаў розных пісьмовых сістэм, пунктуацыйныя знакі і тэхнічныя сімвалы. Частка кодаў зарэзервавана для выкарыстання ў будучыні. Пад сімвалы кірыліцы выдзелены часткі знакаў з кодамі ад U+0400 да U+052F, ад U+2DE0 да U+2DFF і ад U+A640 да U+A69F.

Назва па-беларуску

Назва "Юнікод" уяўляе сабой варварызм: слова (у фанетычнай форме) механічна перанесена з англійскай мовы ў беларускую.

Назва ж "Унікод" больш адпавядае ўнутранай логіцы беларускай мовы, бо:

  • мае яснае паходжанне (этымалогію) ад "Універсальны код";
  • адразу ўліваецца ў сямейства роднасных слоў, звязаных са ўсеагульнасцю і ўніверсальнасцю (унісон, універсітэт, універсал і г.д.).

Кодавая прастора

Хоць кадзіроўкі UTF-8 і UTF-32 дазваляюць кадаваць да 231 (2 147 483 648) кодавых пазіцый, было прынята рашэнне выкарыстоўваць толькі 1 112 064 для сумяшчальнасці з UTF-16. Зрэшты, нават гэтага досыць — сёння (у версіі 6.0) выкарыстоўваецца менш за 110 000 кодавых пазіцый (109 242 графічных і 273 іншых сімвалаў).

Кодавая прастора падзелена на 17 плоскасцей па 216=65 536 сімвалаў. Нулявая плоскасць называецца асноўнай: у ёй размешчаны сімвалы найбольш ужывальных пісьменнасцей. Першая плоскасць выкарыстоўваецца пераважна для гістарычных алфавітаў, другая — для рэдка ўжывальных іерогліфаў кітайскага пісьма, трэцяя зарэзервавана для архаічных кітайскіх іерогліфаў. Плоскасці 15 і 16 выдзелены для выкарыстання ў прыватных выпадках.

Для абазначэння сімвалаў Унікоду выкарыстоўваецца запіс на ўзор U+xxxx (для кодаў 0…FFFF), U+xxxxx (для кодаў 10000…FFFFF), ці U+xxxxxx (для кодаў 100000…10FFFF), дзе кожны x — шаснаццатковая лічба. Напрыклад, сімвал «я» (U+044F) мае код 044F16 = 110310.

Сімвалы-мадыфікатары

image
Камбінаваннем «у» з мадыфікатарам «брэвэ» можна атрымаць сімвал «ў».

Графічныя сімвалы ва Ўнікодзе падзяляюцца на падоўжаныя і непадоўжаныя. Непадоўжаныя сімвалы пры запісе не займаюць месца ў . Да іх адносяць, у прыватнасці, знакі націску і іншую . Як падоўжаныя, так і непадоўжаныя сімвалы маюць уласныя коды. Падоўжаныя коды яшчэ называюць асноўнымі (англ.: base characters), а непадоўжаныя — мадыфікатарамі (англ.: combining characters); прычым апошнія не могуць ужывацца асобна. Напрыклад, сімвал «á» можна закадзіраваць як паслядоўнасць асноўнага сімвала «a» (U+0061) і мадыфікатара « ́» (U+0301), а можна і як маналітны сімвал «á» (U+00C1).

Асаблівы тып мадыфікатараў — селектары варыянту напісання (англ.: variation selectors). Яны ўплываюць толькі на тыя сімвалы, для якіх такія варыянты вызначаны. У версіі 5.0 стандарту варыянты напісання вызначаны для шэрагу матэматычных сімвалаў, для сімвалаў традыцыйнага і для сімвалаў .

Зноскі

  1. The Unicode® Standard: A Technical Introduction (англ.)
  2. History of Unicode Release and Publication Dates (англ.)
  3. The Unicode Consortium (англ.)
  4. Foreword (англ.)
  5. General Structure (англ.)
  6. European Alphabetic Scripts (англ.)
  7. Roadmap to the TIP (англ.)

Спасылкі

  • Афіцыйны сайт Кансорцыума Унікоду (англ.)

Аўтар: www.NiNa.Az

Дата публікацыі: 21 Май, 2025 / 02:40

U getaj staronki nyama praveranyh versij hutchej za ysyo yae yakasc ne acenvalasya na adpavednasc standartam Uniko d angl Unicode vymaylyaecca yak Yuniko d skarachenne ad Universa lny kod standart kadziravannya simvalay yaki dazvalyae adlyustravac litary i znaki amal usih pismovyh moy Standart byy prapanovan u 1991 godze nekamercyjnaj arganizacyyaj angl Unicode Consortium Unicode Inc Vykarystanne getaga standartu dazvalyae nadac kody velmi vyalikaj kolkasci simvalay z roznyh sistem pisma u dakumentah z vykarystannem Unikodu moguc razam vykarystoyvacca kitajskiya ieroglify matematychnyya simvaly litary grechaskaga alfavita lacinki i kirylicy a patreba y peraklyuchenni adpadae Standart skladaecca z dvuh asnoynyh razdzelay universalny nabor simvalay angl UCS universal character set i syamejstva kadzirovak pa anglijsku UTF Unicode transformation format Universalny nabor simvalay vyznachae dakladnuyu adpavednasc simvalay kodam elementam kodavaj prastory yakiya yosc neadmoynymi celymi likami Syamejstva kadzirovak vyznachae mashynny zapis paslyadoynasci koday UCS Kody y standarce Unikod razdzeleny na nekalki chastak Chastka z kodami ad U 0000 da U 007F utrymlivae simvaly z naboru ASCII z adpavednymi kodami Dalej razmeshchany chastki simvalay roznyh pismovyh sistem punktuacyjnyya znaki i tehnichnyya simvaly Chastka koday zarezervavana dlya vykarystannya y buduchyni Pad simvaly kirylicy vydzeleny chastki znakay z kodami ad U 0400 da U 052F ad U 2DE0 da U 2DFF i ad U A640 da U A69F Nazva pa belaruskuNazva Yunikod uyaylyae saboj varvaryzm slova u fanetychnaj forme mehanichna peranesena z anglijskaj movy y belaruskuyu Nazva zh Unikod bolsh adpavyadae ynutranaj logicy belaruskaj movy bo mae yasnae pahodzhanne etymalogiyu ad Universalny kod adrazu ylivaecca y syamejstva rodnasnyh sloy zvyazanyh sa yseagulnascyu i yniversalnascyu unison universitet universal i g d Kodavaya prastoraHoc kadziroyki UTF 8 i UTF 32 dazvalyayuc kadavac da 231 2 147 483 648 kodavyh pazicyj bylo prynyata rashenne vykarystoyvac tolki 1 112 064 dlya sumyashchalnasci z UTF 16 Zreshty navat getaga dosyc syonnya u versii 6 0 vykarystoyvaecca mensh za 110 000 kodavyh pazicyj 109 242 grafichnyh i 273 inshyh simvalay Kodavaya prastora padzelena na 17 ploskascej pa 216 65 536 simvalay Nulyavaya ploskasc nazyvaecca asnoynaj u yoj razmeshchany simvaly najbolsh uzhyvalnyh pismennascej Pershaya ploskasc vykarystoyvaecca peravazhna dlya gistarychnyh alfavitay drugaya dlya redka yzhyvalnyh ieroglifay kitajskaga pisma trecyaya zarezervavana dlya arhaichnyh kitajskih ieroglifay Ploskasci 15 i 16 vydzeleny dlya vykarystannya y pryvatnyh vypadkah Dlya abaznachennya simvalay Unikodu vykarystoyvaecca zapis na yzor U xxxx dlya koday 0 FFFF U xxxxx dlya koday 10000 FFFFF ci U xxxxxx dlya koday 100000 10FFFF dze kozhny x shasnaccatkovaya lichba Napryklad simval ya U 044F mae kod 044F16 110310 Simvaly madyfikataryKambinavannem u z madyfikataram breve mozhna atrymac simval y Grafichnyya simvaly va Ўnikodze padzyalyayucca na padoyzhanyya i nepadoyzhanyya Nepadoyzhanyya simvaly pry zapise ne zajmayuc mesca y Da ih adnosyac u pryvatnasci znaki nacisku i inshuyu Yak padoyzhanyya tak i nepadoyzhanyya simvaly mayuc ulasnyya kody Padoyzhanyya kody yashche nazyvayuc asnoynymi angl base characters a nepadoyzhanyya madyfikatarami angl combining characters prychym aposhniya ne moguc uzhyvacca asobna Napryklad simval a mozhna zakadziravac yak paslyadoynasc asnoynaga simvala a U 0061 i madyfikatara U 0301 a mozhna i yak manalitny simval a U 00C1 Asablivy typ madyfikataray selektary varyyantu napisannya angl variation selectors Yany yplyvayuc tolki na tyya simvaly dlya yakih takiya varyyanty vyznachany U versii 5 0 standartu varyyanty napisannya vyznachany dlya sheragu matematychnyh simvalay dlya simvalay tradycyjnaga i dlya simvalay ZnoskiThe Unicode Standard A Technical Introduction angl History of Unicode Release and Publication Dates angl The Unicode Consortium angl Foreword angl General Structure angl European Alphabetic Scripts angl Roadmap to the TIP angl SpasylkiAficyjny sajt Kansorcyuma Unikodu angl

Апошнія артыкулы
  • Май 19, 2025

    Рэты

  • Май 21, 2025

    Рэстаран

  • Май 19, 2025

    Рэспубліка Кіпр

  • Май 20, 2025

    Рэспубліка Комі

  • Май 20, 2025

    Рэспубліка Ірак

www.NiNa.Az - Студыя

  • Вікіпедыя
  • Музыка
Звяжыцеся з намі
Мовы
Звязацца з намі
DMCA Sitemap
© 2019 nina.az - Усе правы абаронены.
Аўтарскія правы: Dadash Mammadov
Бясплатны сайт для абмену дадзенымі і файламі з усяго свету.
Верхняя частка