記事No | : 379 |
タイトル | : Re: テキストファイルの文字コード自動判別 |
投稿日 | : 2022/10/01(Sat) 15:30:52 |
投稿者 | : おやぶん |
参照先 | : |
自動判別ですが、ファイルの先頭になるBOMで、UNICODEとUTF8かを判別しています。
そのため、これらがない場合には、必ずSHIFT-JISという判別になっています。
UTF-8の場合、BOM無しの場合が多いためかもしれません。
ファイルの先頭を100バイトくらいチェックすればもうちょっと精度が上がるかもしれませんので調べてみます。
- WebForum -