什么是文本文件中“行尾”的UTF-8表示
什么是UTF-8中“行尾”的二进制表示。
在UTF-8(hex)中它 – > 0x0A(0a)
UTF-8(二进制) – > 00001010
有一堆 :
-
LF
: 换行, U + 000A (hexUTF-8:0A) -
VT
:垂直标签, U + 000B (hexUTF-8:0B) -
FF
: 换模, U + 000C (hexUTF-8:0C) -
CR
:回车, U + 000D (hexUTF-8:0D) -
CR+LF
:CR( U + 000D )后跟LF( U + 000A )(hexUTF-8:0D0A) -
NEL
:下一行, U + 0085 (hexUTF-8:C285) -
LS
:线分离器, U + 2028 (hexUTF-8:E280A8) -
PS
:段落分隔符, U + 2029 (hexUTF-8:E280A9)
……可能还有更多。
最常用的是LF
(* nix), CR+LF
(Windows和DOS)和CR
(旧的OSX前Mac系统)。
UTF-8与ASCII兼容,因此换行的ASCII码10(0x0A)和回车的13(0x0D)也用于UTF-8。