Pål Hals, prosjektleder i NLB. [email protected] Skal snakke om: • Talesyntese. Bøker som blir ”innlest” med elektronisk stemme. • DAISY fulltekst bøker.

Download Report

Transcript Pål Hals, prosjektleder i NLB. [email protected] Skal snakke om: • Talesyntese. Bøker som blir ”innlest” med elektronisk stemme. • DAISY fulltekst bøker.

Pål Hals, prosjektleder i NLB.
[email protected]
Skal snakke om:
• Talesyntese. Bøker som blir ”innlest” med elektronisk
stemme.
• DAISY fulltekst bøker. Lydbøker som er synkronisert
med elektronisk tekst.
Hva er talesyntese?
Hei, jeg er heter Brage. Jeg er en såkalt talesyntese. Talesyntese er en
elektronisk stemme. Stemmen består av små lydklipp som settes sammen
til en flytende tale. er en såkalt enhetsseleksjonssyntese.
Demonstrasjon Brage
Elektronisk
Tekst
Konvertering
Lyd
Hvorfor talesyntese?





Produksjon av studielitteratur krever raske produksjonslinjer.
Sesongartet produksjonsbehov – behov for flere produksjonslinjer
Forutsetning for å kunne gi et tilbud til nye brukergrupper
Forutsetning for å kunne øke bredden i tilbudet (ex aviser)
Muliggjør nye tilbud (tidsskrifter, offentlig informasjon)
 Definisjon av ”Høy kvalitet” (høy innlesingskvalitet levert etter
eksamen eller ok kvalitet før første case.
 Definisjon ”Godt nok” – Situasjonsbestemt, prioritere ressurser der
det er behov, bredde vs kvalitet på den enkelte bok
Hvorfor en egen norsk talesyntese?
 Virksomhetskritisk teknologi.
 Sikre tilgang til en norsk talesyntese
 Sikre tilgang til en talesyntese som dekker NLBs behov
 Tilgang til / kompetanse om teknologi.
 Muliggjøre tilpasninger til egne behov basert på egne
premisser.
 Lisenskostnader
Forutsetninger for utviklingsprosjekt
 Tett samarbeid med TPB (Talbok og Punktskriftsbiblioteket)




Kompetanse
Verktøy
Metodikk
Løpende samarbeid NLB/TPB
 Tilgang til Språkbankens uttaleleksikon (729.058 ord)
 Tilgang til egnet tekstkorpus (ca 110 bøker, 60 tidsskrifter, Aftenposten)
(Utgjør 10 800 000 ord)
 Intern kunnskap om innspilling av lyd/lydteknikk.
 Stort pågangsmot og evne til å lære ny teknologi
Valg av innleser
Brage: Mann, bokmål
 Vurderte egne innlesere samt andre ”kjente stemmer”
 ”Stemme alle liker”
 (passer til produksjonsområder, jevn/universell stemme, ingen
særegenheter, tydelighet, tåler komprimering, gode allmenkunnskaper,
relativt dyktig i engelsk)
 Takle krav i innspillingsprosess (samarbeid, utholdenhet)
 Stemmeføringsanalyser – vitenskaplig analyse av stemmer (toneleie,
dynamikk, artikulasjon, rytme, tempo, volum/bæreevne, stemmen håndterer
rask avspilling.
 Innspillingstid: 15.nov – 10.feb (+ romjul)
 Læring
Hva er DAISY
 DAISY : Digital Accessible Information System
 En multimediastandard for digital produksjon og avspilling av
informasjon i lydformat.
 Hensikten er å gi syns- og lesehemmede en økt lesefunksjonalitet
ved bruk av lydbøker.
 Basert på åpne standarder.
 Global standard
DAISY: Kategorier
 DAISY: Ren lydbok. Lydfiler i mp3-format samt navigasjonsfiler.
 DAISY: Fulltekstbok: Lydfiler og teksten synkronisert. Gir mulighet til
å høre og se teksten synkronisert.
 DAISY: Teksten og navigasjonsfiler. Kan benyttes sammen med
talesyntese på egen avspiller. (Kan sees på som en e-bok)
Hvordan produserer vi – hva ønsker vi å produsere
Produksjon med talesyntese: Alltid fulltekst
62 % av studielitteratur, avis, tidsskrifter
Innleste lydbøker – Overveiende kun innlest.
Mål: Øke andel i fulltekst.
*Finne tekniske løsninger for mer effektiv produksjon av fulltekst.
*Definere brukerbehov