huong-3-bieu-dien-du-lieu

Download Report

Transcript huong-3-bieu-dien-du-lieu

CHƯƠNG 3
BIỂU DIỄN DỮ LIỆU
Thông tin
Khái niệm thông tin (information) được sử dụng
thường ngày.Thông tin mang lại cho con người sự
hiểu biết, nhận thức tốt hơn về những đối tượng
trong đời sống xã hội, trong thiên nhiên,... giúp cho
họ thực hiện hợp lý công việc cần làm để đạt tới mục
đích một cách tốt nhất.
Người ta quan niệm rằng, thông tin là kết quả xử lý,
điều khiển và tổ chức dữ liệu theo cách mà nó sẽ bổ
sung thêm tri thức cho người nhận.
98
Ví dụ
Thông tin mô tả về một “con chó” của nhà ta
Tên nó là gì?
Nó là chó ta hay chó nhật?
Nó màu gì?
Tuổi?
Cân nặng?
…
99
Dữ liệu (Data)
Là biểu diễn của thông tin được thể hiện bằng các tín
hiệu vật lý. Thông tin chứa đựng ý nghĩa còn dữ liệu là
các sự kiện không có cấu trúc và không có ý nghĩa nếu
chúng không được tổ chức và xử lý.
Theo quan niệm chung của những người
làm công nghệ thông tin
Thông tin là những hiểu biết của chúng ta về một
lĩnh vực nào đấy, còn dữ liệu là thông tin được biểu
diễn và xử lý trong máy tính.
Bản thân dữ liệu chưa có ý nghĩa, mà nó phải được tổ
chứcvà săp xếp lại thì mới mang một ý nghĩa trọn vẹn.
Dữ liệu có thể được phát sinh, đuợc lưu trữ, có thể
được biến đổi, được tra cứu tìm kiếm và được chuyển
tải từ nơi này đến người khác thông qua các phương
tiện truyền thông tin
101
Tri thức – Knowledge
Tri thức theo nghĩa thường là thông tin ở mức trừu
tượng hơn. Tri thức khá đa dạng, nó có thể là sự kiện, là
thông tin và cách mà một người thu thập được qua kinh
nghiệm hoặc qua đào tạo. Nó có thể là sự hiểu biết
chung hay về một lĩnh vực cụ thể nào đó. Thuật ngữ tri
thức được sử dụng theo nghĩa “hiểu” về một chủ thể với
một tiềm năng cho một mục đích chuyên dụng.
Hệ thống thông tin (information system) là một hệ
thống ghi nhận dữ liệu, xử lý chúng để tạo nên thông
tin có ý nghĩa hoặc dữ liệu mới.
Dữ liệu  Thông tin  Tri thức
xử lý
xử lý
102
Hệ thống thông tin
Hệ thống thông tin(Information system ) là một hệ
thống ghi nhận dữ liệu, xử lý chúng để tạo nên
thông tin có ý nghĩa hoặc dữ liệu mới.
THÔNG TIN
Xử Lý
DỮ LIỆU
ĐẦU VÀO
ĐẦU RA
Đơn vị đo Thông tin
Kí hiệu
Đọc là
Độ lớn
Byte
Bai
8 bit
KB
Ki-lo-bai
210B=1024 B
MB
Me-ga-bai
210 KB
GB
Gi-ga-bai
210MB
TB
Te-ra-bai
210GB
PB
Pe-ta-bai
210TB
2GB B?
Các dạng thông tin
Dạng số
Âm thanh
Văn bản
Hình ảnh
Mã hóa Thông tin
Để đưa thông tin vào
máy tính, ta phải tìm
cách biểu diễn thông tin
sao cho máy tính có thể
nhận biết và xử lý được.
Những thông tin lúc này
đuợc gọi là dữ liệu.
1010111110011
1111010011001
1011010010110
1010110011001
1101111010111
Hệ đếm
 Hệ đếm là tập hợp các ký hiệu và qui tắc sử dụng tập
ký hiệu đó để biểu diễn và xác định các giá trị các số.
 Mỗi hệ đếm có một số ký số (digits) hữu hạn. Tổng
số ký số của mỗi hệ đếm gọi là cơ số. Ký hiệu là b.
Hệ đếm thập phân
Là hệ đếm có cơ số 10
Dùng 10 kí hiệu để biểu diễn: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9
n
n-1
N = an 10 + an-1 10
1
+ …+ a1 10 + a0 10
+ a-1 10 +…+ a-m 10 , 0  ai  9
-1
-m
Ví dụ
12 5 =
1  102 +
2
0

101
+ 5

100
Hệ đếm nhị phân
Hệ đếm cơ số 2
Dùng 2 kí hiệu để biểu diễn: 0, 1
n
n-1
N = an 2 + an-1 2
-1
1
0
+ …+ a1 2 + a0 2
-m
+ a-1 2 +…+ a-m 2 , ai = 0, 1
11012 = 1  23 + 1  22 + 0  21 + 1  20 = 1310
Hệ đếm thập lục phân
Hệ đếm cơ số 16
Dùng 16 kí hiệu để biểu diễn: 0, 1, 2, 3, 4, 5, 6, 7, 8,
9,A,B,C,D,E
N = an 16n + an-1 16n-1 + …+ a1 161 + a0160
+ a-1 16
-1
+…+ a-m 16 , 0  ai  15
-m
1BE16 = 1  16 + 11  16 + 14  16 =
44610
2
1
0
Chuyển đổi hệ 10-> 2,8,16
6
6
0
6(10) =
2
3
2
1
2
1
0
1
2
45
32
16
2
16
13
0
0
0
1 1 0 (2)
2
45(10) =
2 D (16)
Bảng chuyển đổi tương đương
Hệ 10
Hệ 2
Hệ 8
Hệ 16
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
0000
0001
0010
0011
0100
0101
0110
0111
1000
1001
1010
1011
1100
1101
1110
1111
00
01
02
03
04
05
06
07
10
11
12
13
14
15
16
17
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
Biểu diễn số nguyên không dấu
Trong biểu diễn số nguyên không dấu, mọi bit đều được
sử dụng để biểu diễn giá trị số.
Ví dụ 1 dãy 8 bit biểu diễn số nguyên không dấu có giá
trị: 2^8 = 256 số nguyên dương,
cho giá trị từ 0 (0000 0000) đến 255 (1111 1111).
Với n bits ta có thể biểu diễn 1 số nguyên có giá trị lớn
nhất là 2^n-1 và dải giá trị biểu diễn được từ 0 đến 2^n-1.
Ví dụ: 00000000 = 0
00000010 = 2
00000100 = 4
………….
11111111 = 255
Biểu diễn số nguyên có dấu
Trong biễu diễn số nguyên có dấu, bit đầu làm bit dấu: 0 là số
dương và 1 cho số âm. Số nguyên có dấu thể hiện trong máy tính
ở dạng nhị phân là dùng số 1 làm bit dấu
Qui ước dùng bit ở hàng đầu tiên bên trái làm bit dấu
Cách phổ biến biễu diễn số âm có dấu là dùng mã bù 2
Số bù 2 được tính như sau:
Biễu diễn số nguyên không dấu
Nghịch đảo tất cả cả các bit (số bù 1)
Cộng thêm 1 (số bù 2)
Ví dụ biễu diễn trên 8 bits:
37
= 00100101
= 11011010
Bit dấu
+
1
11011011
114
Cộng/ trừ số nguyên không dấu
Khi cộng hai số nguyên không dấu n bits ta thu được một số nguyên không dấu
cũng n bits. Vì vậy,
- Nếu tổng của hai số đó nhỏ hơn hoặc bằng 2^n-1 thì kết quả nhận được là đúng.
- Nếu tổng của hai số đó lớn hơn 2^n-1 thì khi đó sẽ tràn số và kết quả sẽ là sai.
Thí dụ với trường hợp 8 bits, tổng nhỏ hơn 255 thì ta sẽ có kết quả đúng:
57 = 00111001
34 = 00100010
91 = 01011011
209 = 11010001
73 = 01001001
282 = 100011010
Bit tràn ra ngoài
=> kết quả = 26 là sai.
Để tránh hiện tượng tràn số này ta phải sử dụng nhiều bit hơn để biểu diễn.
115
Cộng / trừ số nguyên có dấu
Số nguyên có dấu được biểu diễn theo mã bù hai, vậy qui tắc chung như sau:
Cộng hai số nguyên có dấu n-bit sẽ bỏ qua giá trị nhớ ra khỏi bit có ý nghĩa
cao nhất, tổng nhận được sẽ có giá trị đúng và cũng được biểu diễn theo mã
bù hai, nếu kết quả nhận được nằm trong dải -2^n-1 đến + 2^n
Để trừ hai số nguyên có dấu X và Y (X – Y) , cần lấy bù hai của Y tức –Y, sau
đó cộng X với –Y theo nguyên tắc trên.
Ví dụ: 97 – 52 = 97 + (-52)
97
= 0110 0001
Bit dấu
-52
= 1100 1100
45
= 1 0010 1101
Bỏ qua
Như vậy, khi thực hiện phép tính trên sẽ thừa ra 1 bit bên trái cùng, bit này sẽ
không được lưu trong kết quả và sẽ được bỏ qua.
116
Biểu diễn số thực dạng dấu phẩy động
Ví dụ: 13456,25 = 0.1345625 x 105
M x 10K
- M: phần định trị (0,1  M < 1).
- K: phần bậc (K  0).
Cộng 2 dãy nhị phân
Qui ước
Ví dụ
=
0
0
1
1
1
0
1
0
0
0
0
1
1
0
1
1
0
1
0
1
0
1
0
1
Các phép toán luận lý
Được ko?
Bảng chân trị
P
Q
P AND Q
P OR Q
P XOR Q
0
0
0
0
0
0
1
0
1
0
1
1
2
1
0
0
1
1
3
1
1
1
1
0
Biểu diễn kí tự
Mã hóa thông tin dạng văn bản thông qua việc mã hóa
từng kí tự
Bộ mã ASCII: dùng 8 bit để mã hóa kí tự, mã hóa đuợc
256= 28 kí tự
Bộ mã UNICODE: dùng 16 bit để mã hóa kí tự, mã
hóa đuợc 65536= 216 kí tự
Bảng mã ASCII(mở rộng)
Hex
0
8
9
Ç
128
1
ü
æ
é
3
4
ä
ö
à
å
û
134
7
ç
8
ÿ
ë
è
ï
î
ì
Ä
Å
174
»
159
═
╬
190
╧
┐
175
191
²
253
■
ε
238
∩
223
252
237
222
▀
207
ⁿ
φ
▐
251
236
221
206
√
∞
▌
250
235
220
205
·
δ
▄
249
234
219
204
189
╛
«
ƒ
143
173
158
╠
·
Ω
█
248
233
218
203
188
╜
¡
₧
142
F
172
157
╦
°
Θ
┌
247
232
217
202
187
╝
¼
¥
141
E
171
156
╩
≈
Φ
┘
246
231
216
201
186
╗
½
£
140
D
170
155
╔
÷
τ
╪
245
230
215
200
185
║
¬
¢
139
C
169
154
╚
⌡
μ
╫
244
229
214
199
184
╣
⌐
Ü
138
B
168
153
╟
⌠
σ
╓
243
228
213
198
183
╕
¿
Ö
137
A
167
152
╞
182
╖
º
151
136
9
166
≤
Σ
╒
242
227
212
197
241
≥
π
╘
┼
181
╢
ª
ù
ê
165
150
135
╡
Ñ
149
±
226
211
196
240
225
Γ
╙
─
180
ß
210
195
F
≡
224
209
╥
├
┤
164
╤
194
179
E
α
208
193
┬
│
ñ
ò
┴
178
163
148
133
6
ú
147
132
5
162
D
╨
192
177
▓
ó
ô
131
176
161
146
C
└
▒
í
Æ
â
160
145
130
B
░
á
144
129
2
A
É
254
255
239
Ví dụ
Kí tự
Mã thập phân
Mã nhị phân
T
84
01010100
I
73
01001001
N
78
01001110
“TIN”01010100 01001001 01001110
123