什么是文本文件中“行尾”的UTF-8表示

什么是UTF-8中“行尾”的二进制表示。

在UTF-8(hex)中它 – > 0x0A(0a)
UTF-8(二进制) – > 00001010

在此处输入图像描述

有一堆 :

  • LF : 换行, U + 000A (hexUTF-8:0A)
  • VT :垂直标签, U + 000B (hexUTF-8:0B)
  • FF : 换模, U + 000C (hexUTF-8:0C)
  • CR :回车, U + 000D (hexUTF-8:0D)
  • CR+LF :CR( U + 000D )后跟LF( U + 000A )(hexUTF-8:0D0A)
  • NEL :下一行, U + 0085 (hexUTF-8:C285)
  • LS :线分离器, U + 2028 (hexUTF-8:E280A8)
  • PS :段落分隔符, U + 2029 (hexUTF-8:E280A9)

……可能还有更多。

最常用的是LF (* nix), CR+LF (Windows和DOS)和CR (旧的OSX前Mac系统)。

UTF-8与ASCII兼容,因此换行的ASCII码10(0x0A)和回车的13(0x0D)也用于UTF-8。