Sometimes I have to put text on a path

Wednesday, January 25, 2012

A post (only in french) for tex-latex or xetex and é à ï î ç...; un post en français pour les caractères avec accents

This post is in french because it's focused on the use of french special characters with tex-latex ou xetex.
------intro:
Les caractères accentués et liés (é, à, æ, Å, ø…) n'existent pas en langue anglaise. De fait, le standard informatique ASCII « de base » ne définit que 127 caractères non accentués, dits « caractères ASCII 7 bits ». La norme ASCII définit des caractères étendus, dits « caractères 8 bits », pour chaque pays, ce qui permet d'avoir les caractères éccentués et liés directement sur le clavier. Unicode augmente encore ces aspects. Mais hélas Tex et Latex sont apparus avant unicode... Tout document texte LaTeX peut donc être écrit en ASCII 7bits, ce qui garantit la plus forte interopérabilité.
On va donc limiter ce post à Tex-Latex.


XeTeX (http://fr.wikipedia.org/wiki/XeTeX) est un logiciel de mise en page dérivé de TeX qui utilise l'Unicode et les technologies modernes de polices de caractères telles que OpenType. Initialement développé pour Mac OS X, il est maintenant multiplate-forme. Les fichiers sources sont, par défaut, en utf-8. XeTeX fonctionne avec LaTeX et ConTeXt (macro packages). Sa partie LaTeX est xelatex. Il est utilisé avec le package fontspec, qui permet une interface configurable pour le choix des fonts et permet un choix très vaste de fonts.
XeTeX est incorporé dans les distributions TeX Live 2010, MacTeX 2010 et MiKTeX 2.8.
Unicode et la norme ISO/CEI 10646 attribuent à chaque caractère un nom officiel au sein d’un répertoire commun unifié entre toutes les langues et tous les usages. Dès que le répertoire commun est approuvé, les caractères sont groupés en blocs en fonction de leur usage et des écritures supportées, et reçoivent une identification numérique unique appelée point de code, identifiée généralement sous la forme U+xxxx (où xxxx est un nombre hexadécimal de 4 à 6 chiffres, entre U+0000 et U+10FFFF). La plage définie permet d'attribuer jusqu'à 1 114 112 points de code.

Il y a aussi MathML voir sur ce blog la catégorie "mathML".

 ------généralités LaTeX
Les commandes commencent par une contre-oblique \ suivie de 2 possibilités:
  • un nom composé uniquement de lettres non diacritiés.
    Une espace (en typographie, le mot « espace » est féminin…), un chiffre ou tout autre caractère clôture le nom,
    ex : x\mapsto2 x\mapsto2 ;
  • un seul caractère spécial (non-lettre), ex : \# \#
Remarque: depuis janvier 2003, les formules mathématiques sur Wikipédia peuvent être écrites avec latex: http://fr.wikipedia.org/wiki/Aide:Formules_TeX
où les formules s'écrivent entre .

------les caractères spéciaux (ascii non 7bits)
Les caractères suivant sont utilisés par LaTeX pour la compilation (ils ont une signification particulière pour la mise en forme du texte) et ne peuvent donc figurer tels quels dans le texte :
$ & % # { } _ \ ^ ~
Il faut les remplacer par d'autres. Il suffit de faire figurer une barre de fraction inversée « \ » devant,
\$ \& \% \# \{ \}
sauf pour les 3  caractères suivant (heureusement,  ils sont assez rarement utilisés en tant que tels):
« \ » qui s'écrit \ textbackslash,
« ~ » " \ textasciitilde,
« ^ » " \ textasciicircum.


Si l'on reste toujours sous le même environnement (même type d'ordinateur, même système d'exploitation, même pays), alors on peut utiliser les caractères accentués du clavier, quitte à utiliser l'extension inputenc en mettant :
\usepackage[latin1]{inputenc}
dans l'en-tête du fichier.
ou par exemple  \usepackage[frenchb]{babel} 
ou \usepackage[french]{babel}
Les deux sont absolument identiques mais frenchb indique clairement que l'on veut utiliser le français avec babel d'où le b. L'extension babel facilite l'adaptation de la typographie du document à sa langue comme calc permet d'accomplir des calculs simples. La liste des extensions est interminable ; heureusement, tous les paquetages sont réunis au sein du Comprehensive TeX Archive Network (CTAN).

Mais dans le cas général, si le texte doit être lu dans un autre environnement ou par quelqu'un d'un autre pays, il faut utiliser la frappe suivante avec les "commandes".
Pour mettre un accent aigü, il suffit de faire précéder la lettre de « \' », « \` » pour un accent grave, « \^ » pour un accent circonflexe, et « \" » pour un tréma. De manière générale, on a « \ + accent + lettre ».
Exemple :

é\'e
É\'E
è\`e
à\`a
È\`E
À\`A
ê\^e
â\^a
î\^\i 
ô\^o
û\^u
Ê\^E
Â\^A
Î\^I
Ô\^O
Û\^U
ë\"e



ï\"\i 


ü\"u
Ë\"E



Ï\"I


Ü\"U
NB : pour le « i » accentué, la barre de fraction entre l'accent et le i sert à enlever le point ; il est important de laisser un espace après le i, car certaines instruction commencent elles aussi par \i, comme \it (texte en italique) par exemple (cet espace sera ignoré lors de la compilation). Exemple :
ab\^\i me
pour écrire « abîme » Ajoutons la cédille, le « e dans l'a/o » et le symbole angström (unité de mesure des distances atomiques en physique) :

ç \c c
Ç \c C
æ \ae
Æ \AE
œ \oe
Π\OE
Å \AA
NB : pour la cédille, il est important de laisser un espace après le \c, car certaines instructions commencent elles aussi par \c, comme \chapter (marque le début d'un chapitre) par exemple (cet espace sera ignoré lors de la compilation). Exemple :
fa\c cade
pour écrire « façade » Voici quelques signes de ponctuation particuliers :
  • petit tiret - (signe moins) : « - » ;
  • tiret moyen – (de la largeur d'un « N ») pour les intervalles de nombres : « -- » ;
  • tiret long — (de la largeur d'un « M ») pour les incides (alternative aux parenthèses) : « --- » ;
  • guillemets français « et » : « << » et « >> » (deux signes inférieur et deux signes supérieur).
On peut aussi représenter les accent et caractères espagnols (tilde, points d'interrogation et d'exclamation inversés), norvégiens… Pour connaître les codes à taper, il faut chercher...
Enfin, il existe des caractères spéciaux pour la mise en page :
  • l'espace insécable « ~ », qui n'est pas coupée par un changement de ligne et en français précède notamment les « : ; ! ? » (ces signes sont également suivis d'une espace normale) et se trouve à l'intérieur des guillemets et des tirets d'incise (qui sont eux-même encadrés par des espaces normales) ;
    en typographie française, on écrit …~;, …~!, …~?, <<~…~>> et ---~…~--- ;
  • l'espace forcée « {} » (accolade d'ouverture-accolade de fermeture) ou bien « \  » (barre de fraction inversée-espace), qui est sécable ;
  • et l'espace fine « \, ».

Notes
  • 1 - ASCII : american standard code for instruction interchange retour
  • 2 - un caractère est une lettre, un chiffre, mais aussi un signe de ponctuation, une espace… retour
 Ref: http://deuns.chez.com/latex/carac.html

1 comment:

  1. Thanks for sharing this post. I'm very interested in this topic. https://onlineconvertfree.com Enhancing recordsdata on this format isn't potential since it's a non-editable format. With a view to make any alterations within the matter, one wants utilizing PDF to Phrase changing instrument, because the latter is one the place any type of enhancing will be achieved.

    ReplyDelete