信息数字化(信息编码和数字化)
信息编码是指将信息数字化,信息包括数字、字符、声音、图像等。
数字:用于计数的不同数制或十进制,如十进制、二进制、十六进制和八进制;
字符编码:字符的数字化,包括字母、符号、民族文字(如汉字)等字符的编码方案,如ASCII、Unicode等。
多媒体编码:对不断变化的“模拟量”进行采样和量化,包括声音、图像和视频的数字化以及两者的结合。
1数字编码
可以使用不同的十进制进行计算,如计时采用60十进制,月采用12十进制,周采用7十进制。n进制是指每n加1的基本系统。不同的十进制或数制各有优势或使用习惯。在计算指令中,使用二进制需要更多的比特,但两种状态最容易实现,稳定性高。
2字符编码
对于拉丁语系国家,通常使用ASCII字符编码方案,可以通过键盘简单输入,而不是拉丁语系国家,比如汉字,那是不可能的,所以我们有自己的字符编码方案,比如GB2312,GBK,港台的BIG-5,日本的Shift-JIS等。因此,国际标准化组织(ISO)推出了统一全球字符统一编码的Unicode方案。
同时,字符编码需要考虑中字符的输入、存储和输出。
2.1字符存储:字符编码方案到位后如何存储?例如,可以使用Unicode、utf-8、utf-16、utf-32和其他存储方案。存储需要考虑操作的方便性和存储空之间的节省。
2.2字符输入:有了字符编码和存储方案,如何输入键盘以外的字符?直接输入字符编码方案的字符序列编码肯定不是一种可取的方式,因为不够直观,也不方便记忆。因此,有字符输入方法,如汉字的吴彼输入、拼音输入和自动识别输入(如语音输入和手写输入(字符识别技术))。
2.3字符输出码:又称字形码,通常以点阵的位图形式输出,用于显示和打印。
3多媒体编码
3.1语音编码
它是由振动产生的波。它是一种模拟信息。语音及相关电路可以将声波转换成电压波形,但仍然是连续平滑的模拟信号。只有通过采样和量化,模拟信号才能转换成数字信号。比如在录音的过程中,声源的声音是模拟量,麦克风是传感器,声卡对采样量化后的声音信号进行编码,最终形成数字化的声音文件。
数字化声音的质量取决于采样频率和量化分类的精细程度。采样频率越高,量化分辨率越高,数字化声音的信息资源真实性越好,但数据量越大。
计算文件大小的公式为:采样频率x量化比特数*信道*时间。举个例子,如果一般的CD格式音乐采用44.1kHz的采样频率,16位量化分辨率,立体声二进制,可以计算出每秒的数据量吗?数据量为44100* (16/2) *2= 176400字节,每分钟数据量约为10MB。
采样是以固定的间隔测量连续波的振幅值。
量化就是用二进制标尺测量采样得到的每个脉冲。
3.2图像数字化
图像和视频可以通过扫描仪、数码相机、照相机和其他设备数字化。图像数字化的基本思想是把一幅图像看成由许多点组成,这些点叫做像素,它们纵横排列形成一幅画面。每个像素都有不同的颜色深浅。像素越多,排列越紧密,分辨率越高,图像越清晰。
3.2.1位图图形法:用点阵来描述图像,用一组0和1的代码数据来描述。这种图像也称为位图。
3.2.2矢量作图法:用一些基本的几何元素(直线、圆弧、圆、矩形等)来描述图像。)和填充色块,并用一套指令表达出来。这种图像一般称为图形或合成图像。
采样就是在每个块中取其颜色参数,分解其颜色,计算红、黄、蓝(R、G、B)三原色分量的亮度值。用0和1对每个采样点的每个分量进行编码称为量化。
目前,存在如下一些标准类型的像素深度:
黑白图表。色深1,只有黑白。
灰度(Ggay& Scale)。颜色深度是8,256个灰度级。
8色图表(RGB 8色)。色深为3,用3种原色产生8种颜色。
16色索引(索引16色)。色深为4,建立调色板提供16种颜色。
256色索引图(索引256色)。色深为16,建立调色板提供256种颜色。
真彩色贴图(RGB真彩色)。色深24,提供16,777,216种颜色,大大超过人眼分辨颜色的极限(16,000种颜色)。色深也可以是32,比较真实。
数字图像通常存储在文件中,存储时间空为:
文件字节数=(位图宽度x位图高度x位图颜色深度)/8
4程序编码
程序是用来解决问题和处理数据的,所以问题的解决就是一个数据表示或数字化的过程。有了信息编码,信息就可以通过编程(程序编码)进行处理。程序中的数据表示由变量、文字和数据类型的数据结构来表示。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 ZLME@xxxxxxxx@hotmail.com 举报,一经查实,立刻删除。