大学における研究

Download Report

Transcript 大学における研究

大学における研究
文字/図形/画像データに関する研究
I.文字輪郭線データの圧縮
II.画像データの圧縮
1
1. 評点の変換方法
《意図/背景》
• 試験をしてみたら大多数が不合格(60以
下)の点数となってしまった.
• 適当に点数づけしたものを大部分が60
点以上となるように変換したい.
• 平均値と標準偏差とを与えて全ての評
点を変換する.
2
1. 評点の変換方法
0.05
0.04
割合
0.03
0.02
0.01
0
0
10
20
30
60
40
50
60
70点数 80
70
90
80
90
100
100
3
1. 評点の変換方法
《方法》
• 元の得点:{xi}i=1, ..., N(ここで,N は個数)とす
るとき
• 変換後の平均値 my と標準偏差 sy とを与え
て
• 1次式:yi = axi + b(ここで,a, b は未定々数)
によって
• 変換後の得点:{yi}i=1, ..., N を得る.
4
1. 評点の変換方法
《得られた式》
sy
yi  xi  m x   m y
sx
ここで,
mx:{xi} の平均値
sx:{xi} の標準偏差
5
1. 評点の変換方法
《社会への貢献》
• 大学を含む学校で役立つと信ずる.
6
1. 評点の変換方法
《その他》
• 表計算ソフトウェアを利用すればプログ
ラミングの必要は殆どない.
• 平均値50,標準偏差10とした場合には
「偏差値」(学生の指摘)
• 相対評価(秀5%,優15%,良60%,可
15%,不可5%等)用のプログラムも考え
た.
7
2. 色情報利用による画像領域分割
《意図/背景》
• 白黒TVからカラーTVに買い換え,相撲
放送を見たとき,力士ごとに座布団を入
れ替えていることに気がついた.
• 白黒では見えなかったものが色がつくことによって
見えたのである,当然のことではあるが...
• 色を利用すると効率よく輪郭線を抽出で
きると確信.
8
特定の色を有するモノの
RGB空間における分布
9
白色変換
×平均値(中心)と
半径とを指定して切り出し可能
10
2. 色情報利用による画像領域分割
《方法》
• カラー画像信号はRGB3種類の信号で構成さ
れているので,例えば,画像内の赤い座布団
はRGB3次元空間内の特定の箇所に分布し
ている.
• 3次元空間内の分布は一般に球形ではなく楕
円球に近い.
• 楕円球を球形に変換(白色変換)してやれば,
平均値(中心)と半径とを指定して領域分割
ができる.
11
SIDBA GIRL
肌の領域を切り出したい
12
抽出された肌領域
RGB空間
明度・色度面空間
明度・色度・彩度空間
13
2. 色情報利用による画像領域分割
《明らかになったこと》
RGB信号を
明度・色度面空間あるいは
明度・色度・彩度空間へ変換した上で
白色変換することは,
画像の領域分割に有効
14
2. 色情報利用による画像領域分割
《社会への貢献》
• 不明
15
3. 文字輪郭線の直線と円弧とによる
近似
《意図/背景》
• 誤差少なく,かつ,データ量が小さく文字
輪郭線を表現したい.
• 写植文字のディジタル化の相談あり.
• 印字品質評価の研究の際,標準文字パ
ターンを作成した経験あり.
16
3. 文字輪郭線の直線と円弧とによる
近似
《方法》
• 輪郭点列の並びから標本点を抽出する
際,1つ先の標本点を考慮して最適な標
本点を選択.
17
3. 文字輪郭線の直線と円弧とによる
近似
《明らかになったこと》
• 800×800の碁盤目状の領域に表現され
た「あ」の場合,元の輪郭線データ量の
約5%で殆ど誤差なく直線あるいは円弧を
用いて近似できる.
• 円弧あるいは直線で近似できそうだとい
うことは直感的に分かる.
• が,標本点を設定する手順を具体的に
明らかにした.
18
3. 文字輪郭線の直線と円弧とによる
近似
《社会への貢献》
• アウトラインフォント製作(制作)現場に
おいて参考にされたと信ずる.
19
4. 文字輪郭線の修正
《意図/背景》
• デザイナが紙面上に描いた文字を
走査装置で計算機に入力した
文字図形の輪郭線には凹凸がある.
• 文字輪郭線の凹凸を
機械的に取り除く.
20
4. 文字輪郭線の修正
《方法》
輪郭線のパターンを
シミ/ボイド(spot/void),小突起,
台形型凹凸部,水平/垂直段差,内角,
湾曲部に分類して検出し
それぞれ修正する.
21
修正例
修正前
修正後
22
4. 文字輪郭線の修正
《明らかになったこと/効果》
人手による修正作業の低減.
23
4. 文字輪郭線の修正
《社会への貢献》
• ある会社で実用に供した/している.
• 方々の会社で同様の方法を実用化して
いるのではないかと思う.
24
5. ディジタル文字の変倍方法
《意図/背景》
• 印刷活字の場合,大きさが異なると文字線幅
も変化する.
• 基準の大きさの文字を単純に拡大縮小する
のではない.
• 大きな文字の線幅の方が小さな文字の線幅
より相対的に太い.
• 同一書体の細字体と太字体とから,任意の
太さの文字を生成する.
• 種々の太さの文字を個々に記憶する必要が
なくなる.
25
5. ディジタル文字の変倍方法
《方法》
• 文字輪郭線をベクトルの列として表現し,軸
とベクトルとがなす角で表現する.
• ダイナミックプログラミングを用いて細字体の
輪郭点列と太字体の輪郭点列との対応をと
る.
• 対応する点同士を結ぶ線分を按分して中間
の太さをもつ文字パターンを生成する.
26
ダイナミックプログラミング
• Lichard Bellmanが発見した最適経路問
題の効率的な解を得る手法.
27
ダイナミックプログラミング
最適経路問題
28
ダイナミックプログラミング
29
変倍の例「あ」
対応づけ
中間図形
30
変倍の例「木」
対応づけ
中間図形
31
5. ディジタル文字の変倍方法
《明らかになったこと》
• 素直な中間の太さをもつ文字パターンが
生成できる.
• 文字輪郭線を効率よく記憶する方法を
発見した.
32
輪郭線の効率的な記憶方法
輪郭線の効率的な記述/記憶方法は入山徳夫君(昭和58
年卒,現在(株)コニカ勤務)が考えた.
33
5. ディジタル文字の変倍方法
《社会への貢献》
• 不明
• 面白いと思う
34
6. 3次式Bスプラインに関する考察
《3次式Bスプライン》
節点
制御点
制御点Qiを与えて曲線を生成する
35
6. 3次式Bスプラインに関する考察
《意図/背景》
• Bスプラインは制御点を与えることによって生成さ
れる.
• 曲線は制御点から少し離れた位置に生成される.
• 曲線上には制御点に対応する点−節点−が存在す
る.
• ある制御点を動かすとその制御点の近傍の曲線
が変化する.
• 節点を動かす方が曲線を制御しやすい.
• が,その影響が曲線全体に及ぶ.
• 影響の範囲と大きさについて検討する.
36
節点移動に伴うBスプラインの変化
37
6. 3次式Bスプラインに関する考察
《明らかになったこと》
• 移動した節点に対応する制御点の変動は,
節点を動かした向きと同じで,その変動量は
節点の移動量の約√3倍.
• 移動節点以外の節点に対応する制御点の変
動は,移動節点番号に関して,開曲線の場
合にはほぼ対称であり,閉曲線の場合には
対称.
• 移動した節点から1つ離れるごとにその節点
に対応する制御点の変動量はほぼ1/4にな
り,その移動の向きは交互に逆向き.
38
6. 3次式Bスプラインに関する考察
《社会への貢献/その他》
• 不明
• 3浪学生の受験勉強が役に立った
39
7. 3次Hermite補間多項式を用いた文
字輪郭線の近似
《意図/背景》
ディジタル文字パターンの輪郭点列を
3次Hermite補間多項式で近似し,
補間に必要な点だけを記憶して
データ量を減らす.
40
3次Hermite補間多項式
2点の座標Pi, Pjと
傾きQi, Qjとを与えて
曲線を生成.
41
Butlandの方法による傾きの決め方
42
7. 3次Hermite補間多項式を用いた文
字輪郭線の近似
《方法》
• 3次Hermite補間多項式を用いて文字輪郭線
を区分的に近似する.
• 各セグメントの両端点における傾きはButland
の方法により決定する.
• 近似に必要な点の候補は折れ線近似により
あらかじめ抽出する.
• 候補点の中から動的計画法を用いてHermite
補間多項式による近似に用いる点を選定す
る.
43
候補点と標本点
輪郭線と候補点(-)
標本点(-)
44
7. 3次Hermite補間多項式を用いた文
字輪郭線の近似
《明らかになったこと》
• 800×800の碁盤目上に与えられたディ
ジタル文字パターン「あ」の場合,元の
データ点数の約3%を記憶すれば,最大
で斜め方向1格子間隔の誤差で復元で
きる.
45
7. 3次Hermite補間多項式を用いた文
字輪郭線の近似
《社会への貢献》
• ある会社やその他で参考にしていると信
ずる.
46
8. Bスプラインの制御点の削減
《意図/背景》
• 文字輪郭線データの削減
47
8. Bスプラインの制御点の削減
《方法》
• Bスプラインの曲線形状を保存して制御
点を増加するOsloアルゴリズムが存在
する.
• Osloアルゴリズムの逆変換によって制御
点を削減する.
• 削減する候補の制御点はダイナミックプ
ログラミングによって選定する.
48
制御点の削減例
Bスプライン補間
Hermite補間
49
8. Bスプラインの制御点の削減
《明らかになったこと》
• 許容誤差を0.5,1格子間隔に設定した場
合,制御点がそれそれ約75,80%削減
できる.
50
8. Bスプラインの制御点の削減
《社会への貢献/その他》
• 不明
• 計算が莫大なので実用的ではない.
51
9. 曲面近似による画像圧縮
《意図/背景》
• 厖大な情報量をもつ画像を圧縮すれば,
伝送や蓄積に有効.
• 画像を3次元空間内の曲面と考え,曲面
を近似するという考え方でデータを圧縮
する.
• 2次元平面上の線図形−文字輪郭線−の
データ圧縮だけでは残り約10年の大学
生活を送れない.
52
濃淡画像の3次元立体表現
濃淡表現
立体表現
53
9. 曲面近似による画像圧縮
《方法》
• 与えられた画像領域を逐次十字型に等
分割し,それぞれの小領域−ブロックと
呼ばれる−を三角平面/双1次曲面パッ
チで近似する.
• 各ブロックで許容誤差以下になるまで再
分割を繰り返す.
• ブロック境界における輝度値の段差を補
正する.
54
分割状態/再生画像
ビットレート:0.20bpp,画質:31.22dB
分割状態
再生画像
55
ブロック境界の輝度値の段差
ブロック境界に輝度値の段差が存在するのを発見し,補正
方法を考えたのは長谷川誠君(平成3年卒,現在本学総合
情報処理センター勤務)である.
56
段差補正の効果
補正前(29.09dB)
補正後(29.45dB)
57
JPEGとの比較-肌色チャート
ビットレート0.15bpp(約1.9%に圧縮)
曲面近似 33.39dB
JPEG 21.79dB
58
JPEGとの比較-肌色チャート
ビットレート0.15bpp(約3.8%に圧縮)
曲面近似 36.59dB
JPEG 35.17dB
59
JPEGとの比較-スイスの山村
ビットレート1.50bpp
曲面近似 23.35dB
JPEG 25.15dB
60
JPEGとの比較-スイスの山村
ビットレート3.50bpp
曲面近似 35.89dB
JPEG 34.95dB
61
9. 曲面近似による画像圧縮
《明らかになったこと》
• 曲面近似という考え方で画像が圧縮で
きる.
• 画素あたり8ビットの原画像を0.86ビット
/画素に圧縮したデータから38.8dBの復
元画像がえられる.
• 忠実度が低い場合,JPEGよりもきれい
な画像がえられる.
62
9. 曲面近似による画像圧縮
《社会への貢献/その他》
• 不明
63
10. ウエーブレット変換の応用
《意図/背景》
• 今から10年ほど前にウエーブレットの存
在を知った.
• 李芒さんが1996年4月から1998年3月ま
で2年間助手として滞在.
64
10. ウエーブレット変換の応用
《方法》
• 画像をウエーブレット展開し,展開係数
の大きさ等を利用.
65
10. ウエーブレット変換の応用
《試みた/明らかになったこと》
• 書体判定
• 画像圧縮
• 3次元物体認識
• 画像の分類
• 画像の複雑さの数量化
等を試みたが,
殆どモノになっていない.
66
10. ウエーブレット変換の応用
《社会への貢献/その他》
• 学生の教育
• これから本格的に勉強をしたい.
67
文字に関連するその他の試み
• 毛筆風の肉付け
• 字画の組み合わせによる活字生成方法
• 楷書体→草書体→平仮名アニメーション
• 書体の数量化
• 署名識別
• 芯線字形の抽出
• 文字の低解像度表示
• 漢字ストロークの切り出し
• オンライン文字認識
68
画像に関連するその他の試み
• 地形図から鳥瞰図
• 地形図の電子化
• 設計図面の電子化
• 多項式による画像の近似
• ディジタル画像の再標本化
• 画像の複雑さの数量化
69
その他の試み
• 音声合成
• 音声圧縮
70
71
研究生活の総括
• 数学的な手法を工学へ応用することにとど
まった.
• 一般性があり広い適用範囲のある手法/手
段の開発はできなかった.
• 興味のおもむくまま自由にやってこられたこと,
• 少しは世の中に役立っことができたことに幸
せを感じる.
• 「文字」は終生の研究課題
72