mura632’s blog

自分が学んだ知識や考えをアウトプットする場として使っていきます。

テキストエディタの文字コードについて

お疲れ様です!

 

今日は文字コードでつまずきました! 

DBにデータをインプット、アウトプットするプログラムを作っているときのことです。

 

DBにインポートするファイルがutf-8文字コードで指定になっていました。

しかし、なんどさくらエディタで文字コードを指定して保存しても開き直したらSJIS保存になっているんです...

 

これは①SJISutf-8の判断をエディタができなかったこと、

文字コードの判断材料が原因なのです!

 

まず、①について、全角スペースや全角文字がないテキスト(アルファベットだけ、半角スペースのみなど)であると、SJISUTF-8はほぼ変わらないのです!

 

次に②はエディタ等は上からある程度の行数のみを参考にして文字コードを決めています!

なので、かなり大きなテキストファイルなどではもし前半にUtf-8 と判断する材料がなければ判断的ないのです!

 

これを知っているかどうかで、今後文字コードに惑わされることが少なくなると思います!