63’s blog

都内のSEのブログです(*‘ω‘ *)技術は好きですが仕事は嫌いです。

テキストエディタの文字コードについて

お疲れ様です!

 

今日は文字コードでつまずきました! 

DBにデータをインプット、アウトプットするプログラムを作っているときのことです。

 

DBにインポートするファイルがutf-8文字コードで指定になっていました。

しかし、なんどさくらエディタで文字コードを指定して保存しても開き直したらSJIS保存になっているんです...

 

これは①SJISutf-8の判断をエディタができなかったこと、

文字コードの判断材料が原因なのです!

 

まず、①について、全角スペースや全角文字がないテキスト(アルファベットだけ、半角スペースのみなど)であると、SJISUTF-8はほぼ変わらないのです!

 

次に②はエディタ等は上からある程度の行数のみを参考にして文字コードを決めています!

なので、かなり大きなテキストファイルなどではもし前半にUtf-8 と判断する材料がなければ判断できないのです!

 

これを知っているかどうかで、今後文字コードに惑わされることが少なくなると思います!