BOM(Byte Order Mark) 유니코드 문자에서 LE(little-endian) 인지 BE(big-endian) 인지를 나타내는데 사용한다. BOM은 텍스트의 제일 처음에 위치하며 때로는 없을 수도 있다. UTF-8 의 경우 때로는 BOM 코드가 있어서 문제가 되는 경우도 보았다. 텍스트 에디터는 처음 바이트를 읽어보고 BOM 이 있으면 LE또는 BE로 쉽게 판단할 수 있다. 하지만 만약 없으면 내용을 읽어보고 인코딩 방식을 예상하거나 기본 인코딩으로 동작하는 것 같다.

 

UTF-8의 경우 UTF-16 등과는 다르게 바이트오더가 이미 정해져 있으므로 BOM 코드가 없어도 된다. 종종 웹 상에 파일을 업로드 할 경우 BOM 코드가 있는 UTF-8 문서 때문에 깨져서 보였던 경우가 있었다.

 

http://en.wikipedia.org/wiki/Byte_order_mark

 

+ Recent posts