Decoding escaped unicode in Python 3 from a non-ascii string(从非ASCII字符串解码Python3中的转义Unicode)
问题描述
我现在已经寻找了几个小时,以找到一种方法来完全逆转str.encode调用的结果,如下所示:
"testäch基er".encode("cp1252", "backslashreplace")
结果为
b'testxe4ch\u57faer'
现在我想用
将其转换回来b'testxe4ch\u57faer'.decode("cp1252")
我得到
'testäch\u57faer'
那么我如何取回我的基?我通过使用decode("unicode-ESCRIPE")来实现这一点(它在本例中可以使用),但这假设使用is8859-1而不是cp1252编码的字节,因此介于80和9F之间的任何字符都是错误的。
推荐答案
当我问这个问题时,我还是个新手。现在我明白了,这些后备机制只是用于处理意外错误,而不是用于保存和恢复数据。如果您确实需要一种简单可靠的方法来在ASCII中对单个Unicode字符进行编码,请查看quote和unquote模块中的quote和unquote函数。
这篇关于从非ASCII字符串解码Python3中的转义Unicode的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
织梦狗教程
本文标题为:从非ASCII字符串解码Python3中的转义Unicode
基础教程推荐
猜你喜欢
- Kivy 使用 opencv.调整图像大小 2022-01-01
- Python,确定字符串是否应转换为 Int 或 Float 2022-01-01
- 在 Django Admin 中使用内联 OneToOneField 2022-01-01
- 对多索引数据帧的列进行排序 2022-01-01
- 究竟什么是“容器"?在蟒蛇?(以及所有的 python 容器类型是什么?) 2022-01-01
- kivy 应用程序中的一个简单网页作为小部件 2022-01-01
- matplotlib 设置 yaxis 标签大小 2022-01-01
- 比较两个文本文件以找出差异并将它们输出到新的文本文件 2022-01-01
- Python 中是否有任何支持将长字符串转储为块文字或折叠块的 yaml 库? 2022-01-01
- 在 Python 中将货币解析为数字 2022-01-01
