Document 7518190

Download Report

Transcript Document 7518190

Technologies de la langue
Marché 2006 et Tendances
Martine DEJEAN; Antoine RAULIN
Bureau van Dijk Information Management
Technolangue I-expo
Paris 14 juin 2007
MARCHE DES OUTILS LINGUISTIQUES TRAITANT LES DONNEES
TEXTUELLES ET VOCALES
Etude conduite en 2005-2006 pour la Direction de la Stratégie du Ministère
délégué à l’Enseignement Supérieur et à la Recherche
Actualisation de l’étude 2004 - 13 pays européens (Allemagne, Autriche,
Belgique, Danemark, Espagne, Finlande, France, Grèce, Irlande, Italie, Pays-Bas, RoyaumeUni, Suède).
Extension aux 25 pays de l’UE (Chypre, Estonie, Hongrie, Lettonie, Lituanie,
Luxembourg, Malte, Pologne, Portugal, République tchèque, Slovaquie, Slovénie).
Focalisation sur Marché français
Identification du marché – Analyse qualitative : acteurs présents sur le
marché en 2005-2006
Evaluation de la valeur dégagée
Evolution par construction d’un échantillon sur l’analyse des CA
communiqués sur 5 années consécutives
Lissage des données
Overlap. Coefficient correcteur
CA non basés exclusivement sur la vente de produits linguistiques
Validation experts
Approche macroéconomique
Segmentation basée sur les usages
1
GESTION DU CONTENU
KM, veille, IE, analyse automatique de texte
et de formulaire
2
GESTION DES DOCUMENTS
Gestion des archives,
muti-documents, TCAO
3
TRADUCTION
Traduction automatique,
traduction assistée par ordinateur
4
E-BUSINESS
Portails Internet B2B et B2C, communautés internautes,
accès au catalogue
5
RESSOURCES
LINGUISTIQUES
Thésaurus, dictionnaires, corpus et outils associés
(grammaire, phonèmes)
6
PRODUCTION ET EDITION
Correcteurs, aide à la rédaction,
résumé, dictée vocale, TTS
7
VOCAL ET MULTIMODAL
Call centers, bornes multimédia,
solutions embarquées, jeux vidéos
8
E-LEARNING
Applications pédagogiques, apprentissage des langues,
aide au handicap
9
MOTEURS DE RECHERCHE
INTELLIGENTS
Recherche (Internet, Intranet, Extranet),
traitement du langage naturel, web sémantique
UE à 13 pays
Allemagne, Autriche, Belgique, Danemark, Espagne, Finlande, France, Grèce,
Irlande,Italie,Pays-Bas,Royaume-Uni, Suède
Sociétés présentes
sur au moins
1 des 9 segments
Répartition
Texte/Voix
%
Valeur
dégagée M€
Etude 2006
394
70/30
493
Etude 2004
363
80/20
508
Le Royaume Uni, la France, l’Allemagne font #55% du marché
Stabilité du marché
UE13
Evolution du CA du marché européen des
technologies de la langue - UE 13 pays
millions
d'euros
536
540
513
520
500
484
489
493
2003
2004
480
460
440
2000
2001
2002
Prévisionnel 2005: 507 M€
Amorce d’un retour estimé à la croissance en 2004 semble
se confirmer en 2005 (#+3%)
EUROPE 25 PAYS
Représentativité des acteurs - UE 25 pays
nombre de sociétés
600
500
Sociétés qui ont
communiqué au moins
un chiffre d'affaire
482
400
300
218
200
96
230
96
221
96
193
96
147
96
Sociétés qui ont
communiqué leur CA sur
5 ans consécutifs
Sociétés identifiées
en 2005
100
0
2005
2004
2003
2002
2001
2000
Echantillon représentatif UE 25 : 96 sociétés
Année moyenne de création = 1995
Répartition Texte /voix en cohérence avec celle
constatée pour l’ensemble des 482 sociétés
identifiées.
UE25
Evolution du CA du marché européen des
technologies de la langue - UE 25 pays
millions
d'euros
680
659
660
640
620
600
580
637
597
607
610
2003
2004
560
2000
2001
2002
Hausse du marché de +10,4% en 2001 illustre la bulle internet en 20002001
Prévisionnel 2005: 628 M€
Amorce d’un retour estimé à la croissance en 2004 semble se confirmer
en 2005 (#+3%)
L’UE 13 réalise plus de 80% du CA total
394 acteurs identifiés dans l’UE à 13
482 acteurs identifiés dans l’UE à 25
Répartition de l’offre dans l’UE25 : 72% texte, 28% voix
EUROPE 25 PAYS
Les créations de sociétés ont considérablement augmenté dans les années 1990 et
2000:
2004
(répartition de 252 sociétés
avec CA communiqué)
Répartition
sociétéseuropéennes
européennes
Répartition des
des sociétés
du
traitement
langage
et parlé par
du m archédudes
outilsécrit
linguistiques
pardate
datede
decréation
création
1970
4%
2000
29%
1980
13%
1990
54%
FRANCE 2006
FRANCE
Acteurs présents
sur au moins
1 des 9 segments
Répartition
Texte/Voix/
Texte et
Voix%
Evaluation
marché
en M€
Etude 2006
109
77/10/
13
79
Etude 2004
96
86/6/
8
77
La valeur dégagée représente #16% du marché européen.
La France est le deuxième pays leader après le Royaume Uni
Concentration du marché par la position dominante de quelques leaders :
25 premières sociétés = 80% du CA global du secteur
FRANCE 2006
109 acteurs
CATEGORIES
D'APPLICATIONS (2004)
Répartition
Acteurs mono Acteurs multi - totale des
- catégories
catégories
acteurs par
catégorie
Répartition
totale des
acteurs par
catégorie
(rappel 2002)
Nombre
15
1. Gestion du contenu
4
2. Gestion des documents
3
3. Traduction
1
4. E-business
2
5. Ressources linguistiques texte et voix
5
6. Production et édition
4
7. Interface vocale et multimodale
3
8. E-learning
2
9. Moteurs de recherche intelligents
% Nombre % Nombre % Nombre %
38%
42
23%
57
26%
48
26%
10%
30
17%
34
16%
29
16%
8%
10
6%
13
6%
19
10%
3%
27
15%
28
13%
20
11%
5%
12
7%
14
6%
14
8%
13%
11
6%
16
7%
11
6%
10%
13
7%
17
7%
14
8%
8%
10
6%
13
6%
8
4%
5%
26
14%
28
13%
23
12%
Répartition des acteurs par activité mono
ou multi catégories
36%
39
70
64%
109
100%
96
100%
En 2005 : 36% des acteurs positionnés sur un seul segment d’application
(40% en 2003)
Cartographie des 109 acteurs du marché
France
Evolution de la répartition du marché (1)
Marché de niche
30%
25%
20%
15%
10%
5%
0%
Répartition de l'offre %
Moteurs de
recherche
intelligents
E-learning
Interface
vocale et
multimodale
Production
et édition
Ressources
linguistiques
E-business
Gestion de
document
Traduction
Répartition de la valeur %
Gestion du
contenu
% du total
Le marché des outils linguistiques en France - répartition 2004
Le s segments d'application des technologie s déployées
30%
25%
20%
15%
10%
5%
0%
Répartition de l'offre %
Les segments d'application des technologies déployées
Moteurs de
recherche
intelligents
E-learning
Vocal
Multimodal
Production
Edition
Ressources
linguistiques
E-business
Traduction
Gestion de
document
Répartition de la valeur %
Gestion de
contenu
% du total
Le marché des outils linguistiques en France - répartition 2002
FRANCE ECHANTILLON 46 ACTEURS
CA communiqués sur 5 ans consécutifs (2000-2004)
Analyse de l’évolution en fonction de la valeur dégagée du CA et du résultat
Taux de croissance moyen sur la période = 4,70%
Rentabilité économique devenue positive en 2004 = 1,2%
CA ET RESULTAT (APRES OVERLAP) ECHANTILLON FRANCE
80000000
70000000
60000000
Euros
50000000
40000000
CA TOTAL
30000000
RESULTAT TOTAL
20000000
10000000
0
-10000000
2000
2001
2002
-20000000
Années
2003
2004
FRANCE 2006
1. Gestion du contenu
2. Gestion des documents
3. Traduction
4. E-business
5. Ressources linguistiques
6. Production et édition
7. Interfaces vocales, multimodales
8. E-learning
9. Moteurs de recherche intelligents
Tableau de synthèse de l’échantillon des 46 sociétés françaises
Années
CA (M euros)
Taux de croissance CA
2000
61.9
Taux de croissance CA cumulé (2004-2000)
Résultat (M d’euros)
Taux de croissance Résultat
Taux de croissance Résultat cumulé
(2004-2000)
Effectifs totaux
-3,5
2001
65,2
5,32%
2004
74,2
2,63%
19,87%
-7,5
-5,7
-0,7
0,8
-114,29% 24,00% 87,72% 214,29%
122,86%
1 468
Taux de croissance Effectifs totaux
(2004-2000)
1 467
-0,07%
Taux de croissance cumulé Effectifs totaux
(2004-2000)
Effectifs moyens par société
2002
2003
66,7
72,3
2,32% 8,43%
1 419
1 533
1 563
-3,27% 8,03%
1,96%
6,47%
33
33
32
35
36
FRANCE Noyau dur du marché
Echantillon de 20 sociétés pionnières de l’ingénierie linguistique
L’échantillon des 20 sociétés a généré un chiffre d’affaires de 17,5 millions d’euros en
2004. Le taux de croissance moyen sur la période a été de 12,08% et le taux cumulé
sur 4 ans (2004-2001) a été de 57,24%.
En 2004, 95% des professionnels estimaient que la croissance du marché français est
de 10 à 15% par an, segments texte et voix confondus.
CA
2000
2001
2002
2003
2004
TOTAL
TAUX DE CROISSANCE
11,1
12,2
10%
14,6
20%
16,3
12%
17,5
7%
taux de
croissance
moyen (20042001)
Taux de
croissance
cumulé (20042001)
12%
57%
L’offre est toujours diffuse et disparate : la taille des offreurs de technologie est très
variée
Le périmètre est flottant voire turbulent : plusieurs sociétés disparaissent (liquidation,
rachat ou fusion), d’autres se créent (spin off de sociétés grands comptes, de centres
de recherche, start up).
FRANCE
Evolution du coeur de m arché des outils linguistiques
20000000
15000000
euros
10000000
5000000
CA
0
-5000000
Résultat
2000
2001
2002
-10000000
-15000000
années
2003
2004
FRANCE 2006
CA
Evolution du marché des technologies de la langue 2000-2004
20000000
18000000
16000000
14000000
12000000
10000000
8000000
6000000
4000000
2000000
0
SEGMENT 9
SEGMENT 8
SEGMENT 7
SEGMENT 6
SEGMENT 5
SEGMENT 4
SEGMENT 3
SEGMENT 2
2000
2001
2002
2003
2004
SEGMENT 1
années
1. Gestion du contenu
2. Gestion des documents
3. Traduction
4. E-business
5. Ressources linguistiques
6. Production et édition
7. Interfaces vocales, multimodales
8. E-learning
9. Moteurs de recherche intelligents
Taux de croissance moyen annuel = 12,08%
Porteurs Segment 9 « moteurs de recherche » 31,42% par an
Segment 1 « gestion de contenu » 19% par an
Segment 7 « Applications vocales et multimodales » 15,64%
Segment 3 « Traduction automatique » 13,61%
Influence des facteurs structurels et conjoncturels sur le marché
Le marché des outils linguistiques est directement ou indirectement influencé par l’évolution des
différents éléments structurels et conjoncturels des TIC :
-
les dépenses en NTIC en Europe,
-
les investissements en Recherche et Développement,
-
le marché de l’informatique et des logiciels,
-
la numérisation des données dans les réseaux,
-
divers facteurs socio-économiques et culturels tels que le multilinguisme, Internet,
la convergence numérique et les contenus multimédia…
Impact des facteurs structurels et conjoncturels sur le marché des technologies de la langue
QUELQUES CHIFFRES
Les dépenses en NTIC en Europe à 25 pays sont de 625 milliards € en 2005.
La croissance observée en Europe (# 2,20%) dans l’investissement en TI
selon Aberdeen Group se confirme. Cependant, Celle-ci est trois fois plus
importante en Amérique du Nord (#7,30% en 2004)
La part des dépenses en R&D en Europe est estimé à 200millirrds d’euros en 2004
(1,90% du PIB) Allemagne, France et Royaume Uni en représente 120 milliards
soit 60% du total.
Situation du marché des éditeurs de logiciels en France : 7,2 milliards d’€ avec
2500 entreprises comptabilisant 60 000 personnes
Croissance de la numérisation, du stockage et la répartition des données
numériques dans les réseaux. Les bases structurées ont augmenté de 4% en 2006
et représente 10% des données. Les données non structurées représentent 90%
du total et augmente de 6400% par an (IDC)
Europe = 33,6% du marché mondial des NTIC.
Multilinguisme en Europe = source de d’opportunités et de développement ou
contrainte ? - 450 millions de personnes dans l’UE à 25, 160 millions d’internautes,
55% parlant au moins une seconde langue.
TENDANCES…
La dynamique du marché suit l’évolution des technologies avec la
généralisation du multimédia et de l’Internet mobile, la numérisation de
masse, et le besoin de la communication multilingue.
Les fusions et acquisitions au sein du marché sont de plus en plus
fréquentes et s’expliquent essentiellement par:
- la course au premier entrant influe sur les partenariats,…
- Le marché est toujours marqué par les fusions et les acquisitions.
- La volonté de contrôle des technologies par la demande, enclin à racheter
les sociétés détenteurs de briques technologiques est toujours présente.
La dynamique du marché s’oriente vers une logique de la demande.
Le retour à la croissance du marché semble se vérifier depuis 2004 et la
rentabilité économique marque un retour à l’équilibre pour plusieurs
sociétés en 2005.
Les années 2000 marquent l’avènement de la société de la communication
avec le déploiement de la numérisation du texte, de l’image, de la voix, de la
vidéo en phase industrielle.
Différents facteurs ont participé ces dernières années au développement du marché
européen des technologies de la langue :
- Les différents plans de numérisation publics et privés
- Les réseaux informatiques à très haut débit et sans fil
- La mondialisation accrue du marché des technologies de la langue
avec l’augmentation des partenariats internationaux (stratégiques,
commerciaux, technologiques) et la hausse induite des besoins en
traduction instantanée, qu’elle soit vocale ou textuelle,
- L’Open source :
à la fois opportunité de développement : de plus en plus
stables, évolutives et puissantes, les solutions Open source
restent gratuites et permettent de capitaliser des modèles et
des standards reconnus.
et contrainte concurrentielle à la baisse des coûts : les
développements associés sont parfois lourds et longs, ce qui
peut être un frein au développement d’outils open source ce
sens où les pays émergents qui maîtrisent ces langages
peuvent devenir de sérieux concurrents pour la réalisation de
projets multilingues.
La dichotomie existante entre les données textuelles et vocales s’amenuise voire
disparaît
Le contenu de l’information devenant numérique, il s’affranchit de son support : un
fichier digital textuel peut facilement être converti en fichier audio et vice versa.
La standardisation multiformat poussée par le XML et le web 3.0 devrait accélérer
ces dynamiques et permettre de capitaliser les possibles technologiques d’un univers
NTIC de plus en plus ouvert et multipoints.
PERSPECTIVES
Le marché des technologies de la langue dans la zone de l’Union
européenne devrait évolué et se monter à :
UE 25 pays
610 M€ euros en 2004
628 M€ euros en 2005
774 M€ euros en 2010.
UE 13 pays
493 M€ euros en 2004
507 M€ euros en 2005
625 M€ euros en 2010.
Concernant le cœur du marché des technologies de la langue en
France, le marché est estimé à 45,8 millions d’euros en 2010
(estimation haute).
Les taux de croissance constatés dans le cœur du marché des
outils linguistiques sont plus élevés que ceux dégagés par la
moyenne du marché (12,08% de 2000 à 2004 pour le noyau dur du
marché contre 4,70% pour la moyenne globale).
.