テキストエディタの文字コードについて
お疲れ様です!
今日は文字コードでつまずきました!
DBにデータをインプット、アウトプットするプログラムを作っているときのことです。
DBにインポートするファイルがutf-8の文字コードで指定になっていました。
しかし、なんどさくらエディタで文字コードを指定して保存しても開き直したらSJIS保存になっているんです...
これは①SJISとutf-8の判断をエディタができなかったこと、
②文字コードの判断材料が原因なのです!
まず、①について、全角スペースや全角文字がないテキスト(アルファベットだけ、半角スペースのみなど)であると、SJISUTF-8はほぼ変わらないのです!
次に②はエディタ等は上からある程度の行数のみを参考にして文字コードを決めています!
なので、かなり大きなテキストファイルなどではもし前半にUtf-8 と判断する材料がなければ判断できないのです!
これを知っているかどうかで、今後文字コードに惑わされることが少なくなると思います!