Fondamentaux4 min de lecture
Mot vs caractère : quelle différence et comment compter ?
Un mot = une suite de caractères séparée par un espace. Mais l'apostrophe, le tiret et le chiffre brisent la règle. Voici la convention universelle.
Compter les mots semble trivial. En pratique, « aujourd'hui » compte-t-il pour un ou deux mots ? Et « 1 234 €/m² » ? Les outils ne s'accordent pas. Voici les règles de chacun.
Définitions
- Caractère : toute unité tapée — lettres, chiffres, espaces, ponctuation, emojis, sauts de ligne.
- Mot : suite de caractères contiguës séparée par un séparateur (espace, tabulation, retour à la ligne). Les implémentations divergent ensuite sur la ponctuation et les chiffres.
Comparatif des compteurs
| Texte | Word | Google Docs | Convertly COUNTER |
|---|---|---|---|
| aujourd'hui | 1 | 1 | 1 |
| peut-être | 1 | 1 | 1 |
| 1 234 € | 2 | 2 | 2 |
| email@site.fr | 1 | 1 | 1 |
| C++ | 1 | 1 | 1 |
| 👋 bonjour | 2 | 2 | 2 |
La convention dominante (héritée de Unicode UAX #29 — Text Segmentation) considère qu'un mot est une suite alphanumérique unie par apostrophe, tiret ou point interne. Convertly COUNTER suit cette norme.
Compter les caractères : avec ou sans espaces ?
Deux nombres utiles :
- Caractères avec espaces : la mesure qui compte pour les limites Twitter, SMS, meta description.
- Caractères sans espaces : la mesure académique, utilisée par les universités et certains éditeurs pour facturer une traduction.
Obtenir tous les comptages en un clic
Cas qui prêtent à confusion
- URL :
https://exemple.fr/page= 1 mot (pas de séparateur interne). - Tirets cadratins (—) : séparent les mots si entourés d'espaces, sinon non.
- Saut de ligne : compte comme un caractère, sépare les mots.
- Emojis composés (👨👩👧) : un seul caractère affiché, mais 4 codepoints Unicode. Convertly compte ce que voit l'utilisateur.