信 息 数 字 化
信 息 数 字 化
文本信息
声音信息
图像信息
视频信息
计算机接收的信息有哪些?
信 息 数 字 化
数字、文字、图像、语音以及可视世界的各种信息等,实际上都可以通过采样和量化,用二进制数字序列来表示;数字化后的信息也可以通过转换,还原出原来的信息。这样计算机不仅可以进行计算,也可以通过信息的还原发出声音、显示图像、打电话、发传真、放录像和看电影等。
数字化是计算机处理信息的基础。
信 息 数 字 化
只有0和1两个状态,需要表示0、1两种状态的电子器件很多,如开关的接通和断开,可表示0、1两个数码。使用二进制,电子器件具有实现的可行性。
二进制数的运算法则少,运算简单,使计算机运算器的硬件结构大大简化(十进制的乘法九九口诀表55条公式,而二进制乘法只有4条规则)。
由于二进制0和1正好和逻辑代数的假(false)和真(true)相对应,有逻辑代数的理论基础,用二进制表示二值逻辑很自然。
计算机为什么采用二进制?
信 息 数 字 化
在计算机中采用二进制数表示各种信息 。在二进制中只有0和1两个数码,其运算规则是“逢二进一”。
二进制的加法运算法则:
0+0=0 0+1=1 1+0=1 1+1=10
二进制的乘法运算法则:
0×0=0 0×1=0 1×0=0 1×1=1
信 息 数 字 化
10+10=?
11+10=?
10×10=?
11×10=?
算一算
信 息 数 字 化
位——bit
字节——Byte
b7 b6 b5 b4 b3 b2 b1 b0
基本数据类型——位,字节
在信息学科中,特别是在计算机领域,“代码”具有特指性,是指由0和1两个字符组成的数字代码。
由于计算机只能识别和处理这两种代码,其他的信息(文字、声音、图象、视频)都要转换成由0和1构成的符号串。这个过程也叫信息的编码。
汉字输入系统
内部处理
显示
打印
外码
内码
字形码
信 息 数 字 化
文本来源——直接输入、图形识别、语音识别
文本编码
EBCDIC码——IBM大型机采用
ASCII码——微型机采用
(American Standard Code for Information Interchange)
西文
中文——GB2312-80(1981年颁布)
《信息交换 用 汉字编码 字符集——基本集》
信 息 数 字 化
000
001
010
011
100
101
110
111
0000
NUL
DLE
SP
0
@
P
、
p
0001
SOH
DC1
!
1
A
Q
a
q
0010
STX
DC2
“
2
B
R
b
r
0011
ETX
DC3
#
3
C
S
c
s
0100
EOT
DC4
$
4
D
T
d
t
0101
ENQ
NAK
%
5
E
U
e
u
0110
ACK
AYN
&
6
F
V
f
v
0111
BEL
ETB
‘
7
G
W
g
w
1000
BS
CAN
(
8
H
X
h
x
1001
HT
EM
)
9
I
Y
i
y
1010
LF
SUB
*
:
J
Z
j
z
1011
VT
ESC
+
;
K
[
k
{
1100
FF
FS
,
<
L
\
l
|
1101
CR
GS
-
=
M
]
m
}
1110
SO
RS
.
>
N
^
n
~
1111
SI
US
/
?
O
_
o
DEL
b6b5b4
b3b2b1b0
空 格
空格: 二进制代码
十进制代码
010
0000
25=32
ASCII码基本集:
信 息 数 字 化
000
001
010
011
100
101
110
111
0000
NUL
DLE
SP
0
@
P
、
p
0001
SOH
DC1
!
1
A
Q
a
q
0010
STX
DC2
“
2
B
R
b
r
0011
ETX
DC3
#
3
C
S
c
s
0100
EOT
DC4
$
4
D
T
d
t
0101
ENQ
NAK
%
5
E
U
e
u
0110
ACK
AYN
&
6
F
V
f
v
0111
BEL
ETB
‘
7
G
W
g
w
1000
BS
CAN
(
8
H
X
h
x
1001
HT
EM
)
9
I
Y
i
y
1010
LF
SUB
*
:
J
Z
j
z
1011
VT
ESC
+
;
K
[
k
{
1100
FF
FS
,
<
L
\
l
|
1101
CR
GS
-
=
M
]
m
}
1110
SO
RS
.
>
N
^
n
~
1111
SI
US
/
?
O
_
o
DEL
b6b5b4
b3b2b1b0
信 息 数 字 化
字符的点阵描述
字符的轮廓描述
汉字字形码:
信 息 数 字 化
① 文本信息 ② 声音信息 ③ 图像信息 ④ 视频信息
汉字字形码:
信 息 数 字 化