信息数字化(信息编码和数字化)

信息编码是指将信息数字化，信息包括数字、字符、声音、图像等。

数字:用于计数的不同数制或十进制，如十进制、二进制、十六进制和八进制；

字符编码:字符的数字化，包括字母、符号、民族文字(如汉字)等字符的编码方案，如ASCII、Unicode等。

多媒体编码:对不断变化的“模拟量”进行采样和量化，包括声音、图像和视频的数字化以及两者的结合。

1数字编码

可以使用不同的十进制进行计算，如计时采用60十进制，月采用12十进制，周采用7十进制。n进制是指每n加1的基本系统。不同的十进制或数制各有优势或使用习惯。在计算指令中，使用二进制需要更多的比特，但两种状态最容易实现，稳定性高。

2字符编码

对于拉丁语系国家，通常使用ASCII字符编码方案，可以通过键盘简单输入，而不是拉丁语系国家，比如汉字，那是不可能的，所以我们有自己的字符编码方案，比如GB2312，GBK，港台的BIG-5，日本的Shift-JIS等。因此，国际标准化组织(ISO)推出了统一全球字符统一编码的Unicode方案。

同时，字符编码需要考虑中字符的输入、存储和输出。

2.1字符存储:字符编码方案到位后如何存储？例如，可以使用Unicode、utf-8、utf-16、utf-32和其他存储方案。存储需要考虑操作的方便性和存储空之间的节省。

2.2字符输入:有了字符编码和存储方案，如何输入键盘以外的字符？直接输入字符编码方案的字符序列编码肯定不是一种可取的方式，因为不够直观，也不方便记忆。因此，有字符输入方法，如汉字的吴彼输入、拼音输入和自动识别输入(如语音输入和手写输入(字符识别技术))。

2.3字符输出码:又称字形码，通常以点阵的位图形式输出，用于显示和打印。

3.1语音编码

它是由振动产生的波。它是一种模拟信息。语音及相关电路可以将声波转换成电压波形，但仍然是连续平滑的模拟信号。只有通过采样和量化，模拟信号才能转换成数字信号。比如在录音的过程中，声源的声音是模拟量，麦克风是传感器，声卡对采样量化后的声音信号进行编码，最终形成数字化的声音文件。

数字化声音的质量取决于采样频率和量化分类的精细程度。采样频率越高，量化分辨率越高，数字化声音的信息资源真实性越好，但数据量越大。

计算文件大小的公式为:采样频率x量化比特数*信道*时间。举个例子，如果一般的CD格式音乐采用44.1kHz的采样频率，16位量化分辨率，立体声二进制，可以计算出每秒的数据量吗？数据量为44100* (16/2) *2= 176400字节，每分钟数据量约为10MB。

采样是以固定的间隔测量连续波的振幅值。

量化就是用二进制标尺测量采样得到的每个脉冲。

3.2图像数字化

图像和视频可以通过扫描仪、数码相机、照相机和其他设备数字化。图像数字化的基本思想是把一幅图像看成由许多点组成，这些点叫做像素，它们纵横排列形成一幅画面。每个像素都有不同的颜色深浅。像素越多，排列越紧密，分辨率越高，图像越清晰。

3.2.1位图图形法:用点阵来描述图像，用一组0和1的代码数据来描述。这种图像也称为位图。

3.2.2矢量作图法:用一些基本的几何元素(直线、圆弧、圆、矩形等)来描述图像。)和填充色块，并用一套指令表达出来。这种图像一般称为图形或合成图像。

采样就是在每个块中取其颜色参数，分解其颜色，计算红、黄、蓝(R、G、B)三原色分量的亮度值。用0和1对每个采样点的每个分量进行编码称为量化。

目前，存在如下一些标准类型的像素深度:

黑白图表。色深1，只有黑白。

灰度(Ggay& Scale)。颜色深度是8，256个灰度级。

8色图表(RGB 8色)。色深为3，用3种原色产生8种颜色。

16色索引(索引16色)。色深为4，建立调色板提供16种颜色。

256色索引图(索引256色)。色深为16，建立调色板提供256种颜色。

真彩色贴图(RGB真彩色)。色深24，提供16，777，216种颜色，大大超过人眼分辨颜色的极限(16，000种颜色)。色深也可以是32，比较真实。

数字图像通常存储在文件中，存储时间空为:

文件字节数=(位图宽度x位图高度x位图颜色深度)/8

程序是用来解决问题和处理数据的，所以问题的解决就是一个数据表示或数字化的过程。有了信息编码，信息就可以通过编程(程序编码)进行处理。程序中的数据表示由变量、文字和数据类型的数据结构来表示。

点击展开全文