split の結果がutf-8とならない場合の対処

スポンサーリンク

カテゴリ:その他
Python バージョン:Python2.7
Tensorflowバージョン:Tnsorflow 1.0
OSバージョン:Ubuntu 16.04.2


現象


split の結果で文字コードがutf-8 にならない場合があります。


対策


fileopen 時に utf-8 を指定してみてください。

【前】

with open('/test/filename.csv', 'r') as f:


【後】

f = codecs.open('/test/filename.csv', 'r', encoding='utf-8')


こんな感じが
\xe5\x92\x・・・・・

こんな感じになると成功です。
u'\u5f8b\・・・・・


スポンサーリンク

[Tensorflow FAQ]

[Tensorflow トップへ]


このページは独学で学習した結果をメモした結果です。内容に不備・誤りがある可能性があります。 また今後仕様が変更となり記述が不正確になる可能性もあります。あくまでも自己責任で本ページを参考にしてください。 本サイト内掲載されている情報は、著作権法により保護されています。いかなる場合でも権利者の許可なくコピー、配布することはできません。