Read Unicode UTF-8 file into wstring(将 Unicode UTF-8 文件读入 wstring)
问题描述
如何在 Windows 平台上将 Unicode (UTF-8) 文件读入 wstring(s)?
How can I read a Unicode (UTF-8) file into wstring(s) on the Windows platform?
推荐答案
在 C++11 支持下,您可以使用 std::codecvt_utf8 facet 封装了UTF-8编码的字节串与UCS2或UCS4字符串之间的转换,可用于读写UTF-8文件, 文本和二进制.
With C++11 support, you can use std::codecvt_utf8 facet which encapsulates conversion between a UTF-8 encoded byte string and UCS2 or UCS4 character string and which can be used to read and write UTF-8 files, both text and binary.
为了使用facet,您通常会创建区域设置对象 将特定于文化的信息封装为一组共同定义特定本地化环境的方面.一旦您有了区域设置对象,您可以注入您的流缓冲区:
In order to use facet you usually create locale object that encapsulates culture-specific information as a set of facets that collectively define a specific localized environment. Once you have a locale object, you can imbue your stream buffer with it:
#include <sstream>
#include <fstream>
#include <codecvt>
std::wstring readFile(const char* filename)
{
std::wifstream wif(filename);
wif.imbue(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>));
std::wstringstream wss;
wss << wif.rdbuf();
return wss.str();
}
可以这样使用:
std::wstring wstr = readFile("a.txt");
或者,您可以在使用字符串流之前设置全局 C++ 语言环境, 导致所有未来对 std::locale 默认构造函数的调用返回全局 C++ 语言环境的副本(然后您不需要显式地将其注入流缓冲区):
Alternatively you can set the global C++ locale before you work with string streams which causes all future calls to the std::locale default constructor to return a copy of the global C++ locale (you don't need to explicitly imbue stream buffers with it then):
std::locale::global(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>));
这篇关于将 Unicode UTF-8 文件读入 wstring的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
本文标题为:将 Unicode UTF-8 文件读入 wstring
基础教程推荐
- CString 到 char* 2021-01-01
- 如果我为无符号变量分配负值会发生什么? 2022-01-01
- 为什么派生模板类不能访问基模板类的标识符? 2021-01-01
- 我应该对 C++ 中的成员变量和函数参数使用相同的名称吗? 2021-01-01
- 通过引用传递 C++ 迭代器有什么问题? 2022-01-01
- 初始化列表*参数*评估顺序 2021-01-01
- GDB 显示调用堆栈上函数地址的当前编译二进制文 2022-09-05
- 非静态 const 成员,不能使用默认赋值运算符 2022-10-09
- 为什么 typeid.name() 使用 GCC 返回奇怪的字符以及如 2022-09-16
- 为什么 RegOpenKeyEx() 在 Vista 64 位上返回错误代码 2021-01-01
