[C++]104 FLTK : 正規表現におけるトラブル regex_search バイト列調査

[M1 Mac, Big Sur 11.6.7, clang 13.0.0, NO IDE]

appファイルではregex_searchを使ったひらがな抽出がうまくできないため、バイト列として何が抽出されているのか調べました。

その結果、常に2バイトのデータが返ってきていることが分かりました。本来は3バイト×ひらがな文字数のはずです。実行ファイルでは何の問題もないのに不思議な現象です。

これは仕様の問題にも思えますので、深入りしない方が良さそうです。ひらがな検索は保留としてローマ字検索に方向転換します。

// stringのバイト列への変換
void binary_convert(string str){
	for (int i = 0; i < str.length(); ++i) {
		bitset<8> bs(str[i]);
        string bs_str = bs.to_string();
		cout << str << " " << i+1 << "番目 " << bs << endl;

        output_line2->insert(bs_str.c_str());
        output_line2->insert("\n");
	}
	cout << "end"<< endl;
}