Windowsとインターネット時代の多言語処理
Download
Report
Transcript Windowsとインターネット時代の多言語処理
Windowsとインターネット時代の
マルチリンガル処理
(Windows和因特網時代的多語言処理)
東北大学・東軟信息技術学院・終身教育中心主催
東軟 ITサロン
講演 2002/06/08 10:00~12:00 @ 中国・大連
(IT Salon, Sponsored by Neusoft Institute of Information
Technology, Dalian, China)
multiwi2.ppt
Windowsとインターネット時代の
マルチリンガル処理
全国IBMユーザー研究会連合会主催
iSUC 第11回 札幌大会
講演 2000/11/16 16:30~17:30 @ ロイトン札幌
(IBM Systems Users’ Conference 2000 in Sapporo, Japan)
multiwi.ppt
講演の概要
•
•
•
•
•
全国IBMユーザー研究会連合会主催 2000/11/16(木) 16:30~17:30 R21会場 (25R21) @ ロイトン札幌 http://www.uken.or.jp/isuc/isuc11/ses/
議題:Windowsおよびインターネット時代のマルチリンガル処理
講師:三上吉彦(日本IBM、ソフトウェア事業部 ソフトウェア事業企画)
概要
国際化時代にあって、世界の主な言葉がWindowsとインターネットWebページでどの
ように処理されているかを理解しておくことは重要なことである。この講座では、まず
Windows 95/98で世界の5か国語をフォントとキーボードをどのように具体的にそろえ
て処理できるようになっているかを、例を示しながら解説する。次に、インターネット
Webページでは各国語の内容をどのように用意し、ブラウザーがどのように解釈して
ゆくかを説明する。終りに、最近日本で盛んになっているジャストシステムの「一太郎
Ark」 (100% Pure Javaプログラム) 、日本IBM/Palm Computingの「WorkPad/Palm
Pilot」などにも言及する。講師は「マルチリンガルWebガイド」(O'Reilly & Associates
Japan、1997)などの著書がある。
このプレゼンテーションは次のところで入手可能
http://www.threeweb.ad.jp/logos/mulco/wi/
講演の概要
•
•
•
•
議題:Windowsおよびインターネット時代のマルチリンガル処理
講師:三上吉彦(大連外国語大学外教、もと日本IBMソフトウェア事業部 )
概要
国際化時代にあって、世界の主な言葉がWindowsとインターネットWebペー
ジでどのように処理されているかを理解しておくことは重要なことである。こ
の講座では、まずWindows 95/98で世界の5か国語をフォントとキーボード
をどのように具体的にそろえて処理できるようになっているかを、例を示しな
がら解説する。次に、インターネットWebページでは各国語の内容をどのよ
うに用意し、ブラウザーがどのように解釈してゆくかを説明する。ジャストシ
ステムの「一太郎Ark」 (100% Pure Javaプログラム) 、日本IBM/Palm
Computingの「WorkPad/Palm Pilot」などにも言及する。最後に、中国大連
での課題について参加者で検討する。講師は「マルチリンガルWebガイド」
(O'Reilly & Associates Japan、1997)などの著書がある。
このプレゼンテーションは次のところで入手可能
http://www.threeweb.ad.jp/logos/mulco/wi/
目次
講演の概要
外国語処理の必要性
講師の紹介
わいわい!外国語
Windowsでの外国語
処理
Macintoshでの外国語
処理
主な外国語の処理
英語
フランス語
ロシア語
中国語
ヘブライ語
インターネット発信
一太郎Ark
参考資料
外国語処理の必要性
英語は常に必要
日本企業の海外進出
日本の外国労働者
外国旅行
インターネット受信
インターネット発信
講師の紹介
言葉と文化への興味
英語、ロシア語、フランス語、中国語、インドネシア/マレーシア語、ヘ
ブライ語
著書
「電脳外国語大学」(技術評論社、1991)
「パソコン外国語製品ガイド‘95」(インターナショナル・トムソン・パブ
リッシング、1995)
「マルチリンガルWebガイド」(オライリー・ジャパン、1997)
インターネット
世界の言葉をコンピューターとインターネットで
http://www.threeweb.ad.jp/logos/
MULCO (Multilingual Computing Users' Group) 電子会議
http://www.threeweb.ad.jp/lolgos/mulco/
わいわい!外国語シリーズ
世界の主な言葉で、簡単な表現データ集
V1.0 : IBM ChipCard用(1995)
V2.0 : IBM WorkPadのメモ帳用(2000)
インドネシア/マレーシア語、英語、韓国語、スペイン語、中国語、日本語、
フランス語、ドイツ語、ロシア語
http://ht.vector.co.jp/authors/VA006757/
例
インドネシア/マレーシア語:Terima kasih. ありがとう テリマッ カシー
韓国語:Kamsa hamnida.ありがとう カムサムニダ
スペイン語:Gracias. ありがとう グラーシアス
中国語:謝謝 ありがとう シェーシェ
ロシア語:Спосибо ありがとう スパシーバ
Windowsでの各国語処理
SBCS言語
多言語サポートとキーボード・リソース/フォントを入れておく。
コントロール・パネル-->アプリケーションの追加と削除 -->Windowsファ
イルで、多言語サポートをクリック
キーボード-->言語で、必要な言語のキーボードをクリック
使用の際は、左Alt-Shiftで言語を切り替える
DBCS言語
MicrosoftホームページからIMEをダウンロード
マルチリンガル処理ソフト
Outlook Express、Outlook、Word 2000、Windows 2000 WordPad
Global Office for MS Office (Unitype、日本では都輝商事
http://www.unirec.comが販売)、Chinese Writer、一太郎Ark(ジャスト
システム)、多言語エディター(各種)
Windows用欧米言語用コード
(Code Page 1252)
Macintoshでの各国語処理
漢字Talk 7.1(1992年)以降
マルチリンガル用にWorldScript Ⅰ&Ⅱ
別売 Language Kit
Arabic、Chinese、Cyrillic、Hebrew、Indian、Japanese、Korean
以前から、西ヨーロッパ諸語の簡便な入力方法(Otionキー+..+..)
Mac OS 9 (1999年)以降
全Language KitがCD-ROMに入っている
各LK別にインストールできる
Mac OS X (2000年)試用版
Macintosh用欧米言語用コード
(Standard Roman Character Set)
英語
米国英語(US English)と英国英語(UK English)
米国英語圏:中南米諸国、フィリピン、韓国、中国、台湾、日本
英国英語圏:ヨーロッパ、アフリカ、中近東、オーストラリア、シンガポール、香港
日本からの英語発信でおすすめ
米国英語、ヘボン式ローマ字
その他:http://www.threeweb.ad.jp/logos/mlweb/part3.html#p224
英語Webページ
コードページを明示する: HTMLの<HEAD>...</HEAD>部分に
<META http-equiv="Content-Type" content="text/html; charset=iso-88591"> を入れる
ホームページ・ビルダーでは、ツール-->オプション-->ファイルで1番下の「文字エ
ンコードをMETAタグで指定する」にチェックマークを入れて、その窓で「ISO8895-1」を選ぶ。全角文字を絶対に入れないこと
フランス語
フランス語(French)の特徴
アクセント符号を多用する
鋭アクセント(acute accent = ')、鈍アクセント(grave accent = `)、
曲りアクセント(circumflex accent = ^)、分音符号(trema='')
フランス語処理
英語処理とほぼ似ている(Word-wrapなど)
キーボード
フランス・キーボード(AZERTY配列) 注:英語のQWERTY配
列になっていない
カナダ・フランス語キーボード(QWERTY配列)
アクセント符号を入力でカーサーは動かず、文字を入力するとア
クセント付き文字が出る(dead key sequence)
フランス語(続き)
フランス語処理(続き)
ピリオド(point)、カンマ(virgule)以外の句読点は、その前にも1スペース
フランス語Webページ
コードページを明示する: HTMLの<HEAD>...</HEAD>部分に次を入
れる
<META http-equiv="Content-Type" content="text/html;
charset=iso-8859-1">
Named Character Reference
Je vais à l'école.-->Je vais a l'ecole.
Non-Break Space( )を使い、句読点を直前の語とword-wrapさ
せる
... deux personnes : ma soeur et mois.
フランス・キーボード(左) &
カナダ・キーボード(右)
ロシア語
ロシア語(Russian)の特徴
キリル文字(Cyrillic Characters)を使用
聖書を始めてスラブ語に訳した聖キリル(St. Cyril)・聖メトーディ
(St. Methodius)兄弟による
А(アー=A)、Б(ベー=B)、В(ヴェー=V)、Г(ゲー=G)、Д(デー
=D)...Я(ヤー=YA)
日本語IMEで「ろしあ」と入れて変換を押すと、全角キリル文字
が得られる
キリル文字が他でも使用
東スラブ諸語(ベラルーシ語、ウクライナ語など)
南スラブ諸語(マケドニア語、ブルガリア語など)
モンゴル語
ロシア・キーボー
ロシア語コード(KOI8-R)
中国語
中国語(Chinese)の特徴
5大方言があるが、中国大陸でも台湾でも、書き言葉と学校教育/マスコ
ミは北京語(普通話 プ-トンフア)で統一
大陸は簡体字(Simplified Chinese、例:中国、儿童)、台湾は繁体字
(Traditional Chinese、例:中國、兒童) [日本語は中国、児童]
ふりがなは、大陸がピンイン(ローマ字)、台湾が注音字母(子音・母音か
らなるカタカナ、別称:ボポモフォ)
中国語処理
通常、簡体字処理はGB(国家標準)コード、繁体字処理はBig5コード
キーボード・リソースとフォント
インターネットでキーボードリソース/フォントをダウンロード
http://www.microsoft.com/windows/ie_intl/ja/ime.htm
Chinese Writer(高電社)、C-Wnn(オムロン・ソフトウェア)、NiHao(ク
リエイト大阪)などのソフト
中国語繁体字コード(Big5)
ヘブライ語
ヘブライ語(Hebrew)の特徴
語は、ヘブライ語でショレーシュ(shoresh)と呼ばれる3子音が基礎
フ9口=RFS(読む、本): sefer 本、sipur 物語り、sofer 著者、sifrut 文学、
sifrya 図書館、など
文字は普通右から左へ子音のみを書き、母音は省略(初学者用には上
下の点で)。数字、英文は左から右へ
ヘブライ語の処理
Global Office for MS Office (Unitype)、Word 2000 under Windows
2000など
アラビア語(Arabic)の処理も似ている
アラビア語では文字が、単語の始め、中、終り、独立かにより、字形が
変化
インターネットで発信
多言語ホームページの3つの型
言語ボタンで切り替え
各言語は各国の子会社で運営
1つのページに多言語を
Unicode(UTF-8)を使ったWebページが増えている
英語ページの注意点
ホームページ作りソフトでは、まずコードページを設定
全角英字は使わない
マルチリンガル・エディター
Windows 2000 WordPad、xyzzyなど
参照: http://homepage1.nifty.com/hobit/html/utf8.html
一太郎Ark
一太郎Arkの特徴
Javaを使った簡易ワープロ
マルチリンガル処理が得意。ただしフォントなどはOSのを利用
Webとの親和性
様々なプラグイン・ソフトができている(例:他国語リソース)
詳しくは、http://www.justsystem.co.jp/ark/
マルチリンガル・ワープロとして
日本語、フランス語、ドイツ語、ロシア語、中国語繁体字、中国語
簡体字の使用例(多国語聖書)
http://www.justsystem.co.jp/ark/review/04.html (日本語)
http://www.justsystem.co.jp/ark/review/04.html (英語)
一太郎Arkでマルチリンガル聖書
参考資料
書籍
「マルチリンガルWebガイド」(オライリー・ジャパン、1997)
http://www.threeweb.ad.jp/logos/mlweb/ (追加情報)
インターネット
世界の言葉をコンピューターとインターネットで
http://www.threeweb.ad.jp/logos/
わいわい!外国語シリーズ
http://ht.vector.co.jp/authors/VA006757/
MULCO (Multilingual Computing Users' Group) 電子会議
http://www.threeweb.ad.jp/logos/mulco/
日本語、フランス語、ドイツ語、ロシア語、中国語繁体字、中国語簡体字の
使用例
http://www.justsystem.co.jp/ark/review/04.html
高橋誠さんの「Windows 98/2000上でのUTF-8のページの作り方(エディ
ターの紹介など) 」
http://homepage1.nifty.com/hobit/html/utf8.html
今日の課題
Windows 2000
Multilanguage User Interface
(MUI)
Multilanguage Windows Version
CD1: 11言語 & CD2: 17言語
http://www4.xdsl.ne.jp/~ibuki/mui.html
Windows XP
Office 2002 Multilanguage Support
中国・大連
ソフトウェア輸出基地とし
ての中国・大連
日本・韓国/朝鮮・ロシア
などへの至近性
日本のソフトウェア開発
の基地
そこにおける言語の準備