h5 建站网站 移动端,做卖挖掘机的网站,公司网站怎么建立需要多少钱,会员管理系统免费版先自我介绍一下#xff0c;小编浙江大学毕业#xff0c;去过华为、字节跳动等大厂#xff0c;目前阿里P7
深知大多数程序员#xff0c;想要提升技能#xff0c;往往是自己摸索成长#xff0c;但自己不成体系的自学效果低效又漫长#xff0c;而且极易碰到天花板技术停滞…先自我介绍一下小编浙江大学毕业去过华为、字节跳动等大厂目前阿里P7
深知大多数程序员想要提升技能往往是自己摸索成长但自己不成体系的自学效果低效又漫长而且极易碰到天花板技术停滞不前
因此收集整理了一份《2024年最新Linux运维全套学习资料》初衷也很简单就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
既有适合小白学习的零基础资料也有适合3年以上经验的小伙伴深入学习提升的进阶课程涵盖了95%以上运维知识点真正体系化
由于文件比较多这里只是将部分目录截图出来全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频并且后续会持续更新
如果你需要这些资料可以添加V获取vip1024b 备注运维
正文
一、字符集本概念
字符集的基本概念如下 : 字符(Character)是指人类语言中最小的表义符号。例如’A’、’B’等给定一系列字符对每个字符赋予一个数值用数值来代表对应的字符这一数值就是字符的编码(Encoding)。例如我们给字 符’A’赋予数值0给字符’B’赋予数值1则0就是字符’A’的编码给定一系列字符并赋予对应的编码后所有这些字符和编码对组成的集合就是字符集(Character Set)。例如给定字符列表为{’A’,’B’}时{’A’0, ‘B’1}就是一个字符集字符序(Collation)是指在同一字符集内字符之间的比较规则确定字符序后才能在一个字符集上定义什么是等价的字符以及字符之间的大小关系每个字符序唯一对应一种字符集但一个字符集可以对应多种字符序其中有一个是默认字符序(Default Collation)MySQL中的字符序名称遵从命名惯例以字符序对应的字符集名称开头以_ci(表示大小写不敏感)、_cs(表示大小写敏感)或_bin(表示按编码值比较)结尾。例如在字符序“utf8_general_ci”下字符“a”和“A”是等价的。
二、常见字符集
1 ASCII
ASCII是英文American Standard Code for Information Interchange的缩写,美国标准信息交换代码是由美国国家标准学会(American National Standard Institute , ANSI )制定的标准的单字节字符编码方案用于基于文本的数据。是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语和其他西欧语言。它是现今最通用的 单字节编码系统并等同于国际标准ISO/IEC 646。
ASCII 码使用指定的7 位或8 位二进制数组合来表示128 或256 种可能的字符。标准ASCII 码也叫基础ASCII码使用7 位二进制数来表示所有的大写和小写字母数字0 到9、标点符号 以及在美式英语中使用的特殊控制字符。
2GBK
GBK即汉字内码扩展规范K为扩展的汉语拼音中“扩”字的声母。英文全称Chinese Internal Code Specification。GBK编码标准兼容GB2312共收录汉字21003个、符号883个并提供1894个造字码位简、繁体字融于一库。
GB2312码是中华人民共和国国家汉字信息交换用编码全称《信息交换用汉字编码字符集——基本集》1980年由国家标准总局发布。基本集共收入汉字 6763个和非汉字图形字符682个通行于中国大陆。新加坡等地也使用此编码。GBK是对GB2312-80的扩展也就是CP936字码表 (Code Page 936)的扩展之前CP936和GB 2312-80一模一样。
3latin1
Latin1是ISO-8859-1的别名有些环境下写作Latin-1。
ISO-8859-1 ISO-8859-1编码是单字节编码向下兼容ASCII其编码范围是0x00-0xFF0x00-0x7F之间完全和ASCII一致0x80-0x9F之间是控制字符0xA0-0xFF之间是文字符号。
ISO-8859-1收录的字符除ASCII收录的字符外还包括西欧语言、希腊语、泰语、阿拉伯语、希伯来语对应的文字符号。欧元符号出现的比较晚没有被收录在ISO-8859-1当中。
因为ISO-8859-1编码范围使用了单字节内的所有空间在支持ISO-8859-1的系统中传输和存储其他任何编码的字节流都不会被抛弃。换言之把其他任何编码的字节流当作ISO-8859-1编码看待都没有问题。这是个很重要的特性MySQL数据库默认编码是Latin1就是利用了这个 特性。ASCII编码是一个7位的容器ISO-8859-1编码是一个8位的容器。
4UTF-8
UTF-88-bit Unicode Transformation Format是一种针对Unicode的可变长度字符编码又称万国码。由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到4个字节编码UNICODE字符。用在网页上可以同一页面显示中文简体繁体及其它语言如日文韩文
UTF-8以字节为单位对Unicode进行编码。
UTF-8的特点是对不同范围的字符使用不同长度的编码。对于0x00-0x7F之间的字符UTF-8编码与ASCII编码完全相同。UTF-8 编码的最大长度是4个字节。
从上表可以看出4字节模板有21个x即可以容纳21位二进制数字。Unicod的最大码位0x10FFFF也只有21 位。 三、MySQL字符集转换过程 MySQL Server收到请求时将请求数据从character_set_client转换为character_set_connection 进行内部操作前将请求数据从character_set_connection转换为内部操作字符集其确定方法如下:
使用每个Column的CHARACTER SET设定值如未设置Column的Character SET则使用对应表的DEFAULT CHARACTER SET设定值如Column、Table均未设地Charater SET则使用对应数据库的DEFAULT CHARACTER SET设定值如Column、Table、Database均未设地Charater SET则使用character_set_server设定值。
将操作结果从内部操作字符集转换为character_set_results 四、中文乱码现象
Mysqldump导入乱码 Load data导入乱码 五、程序及MySQL字符集配置情况
出现乱码情况首先确认写入程序使用的字符集MySQL使用的字符集 MySQL使用的字符集情况
通过SHOW VARIABLES LIKE ‘character%’在上面例子中通过语句获得字符集设置情况如下: Mysqldump导入乱码原因 :
1、 首先确认mysqldump –help或查看备份文件头部信息确认默认字符集 在上例中通过mysqldump –help查看
通过备份文件查看
最后的话
最近很多小伙伴找我要Linux学习资料于是我翻箱倒柜整理了一些优质资源涵盖视频、电子书、PPT等共享给大家
资料预览
给大家整理的视频资料 给大家整理的电子书资料 如果本文对你有帮助欢迎点赞、收藏、转发给朋友让我有持续创作的动力
网上学习资料一大堆但如果学到的知识不成体系遇到问题时只是浅尝辄止不再深入研究那么很难做到真正的技术提升。
需要这份系统化的资料的朋友可以添加V获取vip1024b 备注运维
一个人可以走的很快但一群人才能走的更远不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人都欢迎加入我们的的圈子技术交流、学习资源、职场吐槽、大厂内推、面试辅导让我们一起学习成长 化的资料的朋友可以添加V获取vip1024b 备注运维** [外链图片转存中…(img-UzUGUyT9-1713586183310)]
一个人可以走的很快但一群人才能走的更远不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人都欢迎加入我们的的圈子技术交流、学习资源、职场吐槽、大厂内推、面试辅导让我们一起学习成长