Iscii Devanagari Font Unicode
ISOCEI 1. 06. 46 Wikipdia. La norme ISOCEI 1. Technologies de linformation Jeu universel de caractres cods JUC, tente de dfinir un systme de codage universel pour tous les systmes dcriture. Cette norme est le fondement du standard Unicode. La norme internationale ISOCEI 1. JUC, en anglais Universal Character Set UCS comme un jeu de caractresabstrait. Chaque caractre abstrait est identifi par un nom unique un en anglais et un en franais et associ un nombre entier positif appel son point de code ou position de code. Environ 1. 10 0. 00 caractres symboles, lettres, nombres, idogrammes, logogrammes issus de langues, systmes dcriture, traditions du monde entier sont recenss dans le JUC. De nouveaux caractres provenant dcritures plus rares ou plus anciennes, ou encore de systmes nouveaux, sont frquemment ajouts ou mis jour dans le JUC. Depuis 1. 99. 1, le Consortium Unicode collabore avec lISO pour dvelopper le Standard Unicode Unicode et la norme ISOCEI 1. Les rpertoires, noms de caractres, et points de code de la Version 2. Unicode correspondent exactement ceux de la norme ISOCEI 1. Chaque publication dune nouvelle version dUnicode donne ensuite lieu une mise jour de la norme, cest dire ladjonction de nouveaux caractres et la mise jour de ceux dj prsents. Par exemple, la publication dUnicode 3. ISOCEI 1. 06. 46 1 2. Voir la section Relation avec Unicode pour plus de dtails. Le JUC comprend plus d1,1 million de points de code, mais seuls les 6. Plan Multilingue de Base, ou PMB ont t vulgariss avant 2. Cette situation commena changer quand la Chine populaire RPC lgifra en 2. GB 1. 80. 30, ce qui ncessitait que les systmes informatiques mis la vente dans la RPC utilisent des caractres au del du PMB. Devanagari script vowels top, consonants bottom in Chandas font. Multilingual Editor Use this freely downloadable application to prepare text in Devanagari script for deployment on the web. Annexes Articles connexes. Unicode Codages de caractres UTF8 UTF16 UTF32 normes ISO en rapport ISO 646 ISO 2022 ISO 6429 ISO 8859 ISO 14651 ISO 15924. Top of Page. Choose an encoding standard when you save a file. If you dont choose an encoding standard when you save a file, Word encodes the file as Unicode. Le systme laisse dlibrment beaucoup de points de code non assigns des caractres, mme dans le PMB. Cela permet de mnager des extensions futures ou de minimiser les conflits avec dautres codages. Formes de codage du jeu universel de caractres codsmodifier modifier le codeISOCEI 1. La plus simple, UCS 2, qui a t supprime dans la version 2. Ainsi, exactement deux octets, soit un mot de 1. PMB, la condition que le point de code soit assign, cest dire quil reprsente effectivement un caractre. Cette forme de codage est obsolte car elle ne permet pas de reprsenter les points de code extrieurs au PMB. Le premier amendement de ldition originale dISOCEI 1. UTF 1. 6, une extension dUCS 2, pour reprsenter les points de code extrieurs au PMB, reprise ensuite par Unicode. Il existe dans le PMB une plage appele zone dindirection dont les points de code ne sont pas assigns des caractres. UCS 2 interdit lutilisation de valeurs de code pour ces points de code, mais UTF 1. PMB. Cette plage est subdivise en deux parties gales, une partie haute et une partie basse, et chaque paire est constitue dune unit de code de chacune de ces zones. Les lments de la premire moiti haute sont appels demi codets hauts dindirection et ceux de la seconde moiti basse demi codets bas dindirection . On rencontre aussi le terme de seizet dindirection. Un autre codage, UTF 3. UCS 4, utilise une seule valeur entre 0x. FFFFFFF pour chaque caractre bien que maintenant le JUC sarrte 0x. FFFF et ISOCEI 1. UCS 4 permet la reprsentation de chaque valeur par exactement quatre octets soit un mot de 3. UTF 3. 2 permet donc une reprsentation binaire de chaque code point du JUC, y compris ceux en dehors du PMB. Comme en UCS 2, chaque caractre cod a une taille fixe en octets, qui fait quil est simple manipuler, mais bien sr, il ncessite deux fois plus de mmoire que lUCS 2. Occasionnellement, les articles sur Unicode mlangent les concepts UCS 2 et UCS 1. UCS 1. 6 nexiste pas les auteurs qui font cette erreur essayent de parler dUCS 2 ou dUTF 1. LOrganisation internationale de normalisation ISO a commenc composer le jeu universel de caractres en 1. ISO 1. 06. 46 en 1. Hugh Mc. Gregor Ross en tait un de ses principaux architectes. Ce standard diffrait nettement du standard actuel. Il dfinissait 1. F et 0x. 80 0x. F, en notation hexadcimale. La lettre latine capitale A, par exemple, se situait dans le groupe 0x. Les caractres de ce premier ISO 1. UCS 4, quatre octets pour chaque caractre, permettant le codage facile de tous les caractres UCS 2, deux octets pour chaque caractre, permettant le codage immdiat du premier plan 0x. ISO 2. 02. 2 UTF 1, qui codait tous les caractres en squences doctets de longueur variable 1 5 octets, chacun deux ne contenant aucun caractre de contrle. En 1. 99. 0, deux initiatives pour un jeu de caractres universel UCS existaient Unicode, avec 1. Unicode, dont la premire publication remonte 1991, a t dvelopp dans le but de remplacer lutilisation de pages de code nationales. ISO 1. 06. 46. Les entreprises du logiciel refusrent la complexit et les exigences de taille de la norme ISO et surent convaincre plusieurs organismes nationaux membres de lISO de voter contre. Les normalisateurs de lISO ralisrent quils ne pouvaient continuer supporter la norme en ltat et ngocirent lunification de leur standard avec Unicode. Deux changements eurent lieu la leve des limitations sur les caractres prohibition des valeurs de caractres de contrle, permettant ainsi des caractres tels que 0x. F, et la synchronisation du rpertoire du plan multilingue de base avec celui dUnicode. Cependant, le temps passant, la situation changea dans le standard Unicode lui mme 6. UTF 1. 6. Pour cette raison, ISO 1. UTF 1. 6, cest dire peine plus dun million de caractres au lieu de plus de 2 milliards. Le codage UCS 4 de lISO 1. Unicode avec la limitation de lUTF 1. UTF 3. 2. Quant UTF 1, personne ne lutilisait, en raison de son mauvais design aucune manire de distinguer les octets solitaires, les octets de dbut de squences et les autres octets, un problme similaire celui du codage Shift JIS pour le japonais et de faibles performances beaucoup doprations de division. Rob Pike et Ken Thompson, les dveloppeurs du systme dexploitation Plan 9, conurent un nouveau codage de taille variable, rapide et bien conu, qui finit par tre appel UTF 8. ISO 1. 06. 46 et Unicode ont un rpertoire identique et numrotent les mmes caractres avec les mmes nombres. La diffrence entre les deux est quUnicode ajoute des rgles et spcifications au standard ISO 1. ISO 1. 06. 46 est une simple table de caractres, une extension des standards prcdents comme ISO 8. En revanche, Unicode ajoute des rgles de collation, normalisation de formes, et dalgorithme bidirectionnel pour les critures comme lhbreu et larabe. Pour linteroprabilit entre les plates formes, spcialement quand les critures bidirectionnelles sont utilises, il ne suffit pas de supporter lISO 1. Unicode doit tre implment. Certaines applications supportent les caractres ISO 1. Unicode. Une de celles l est xterm, qui peut correctement afficher tous les caractres ISO 1. Il peut grer certaines marques combinatoires par mthodes de simple surimpression, mais ne peut afficher lhbreu bidirectionnel, la dvangari un caractre pour plusieurs ils ou larabe deux fonctionnalits. La plupart des applications interface graphique utilisent des fonctionnalits de trac de bibliothques standard qui grent de tels systmes dcriture, bien que les applications elles mmes ne les traitent toujours pas exactement correctement.