最近刷题的时候,发现大家都喜欢用 bufio.Scanner 或 bufio.Reader 来从标准输入获取数据,遂来了解一下它们的特性。
文中为了调试方便,使用的 strings.NewReader("input string") 暂时替换 os.Stdin,实际从标准输入获取时可直接使用 os.Stdin 进行替换。
bufio.Scanner
简单来讲,bufio.Scanner 是 Go 中一个用于逐个读取输入缓冲区的扫描器,通常与 bufio.Reader 一起使用,bufio.Reader 用于从输入中读取数据,而 bufio.Scanner 则用于逐个读取输入缓冲区的内容。
bufio.Scanner 可以将输入数据分解为逻辑上的行并返回。Scanner 通过定义一个 Split 函数来将输入分解为行,默认是使用的 bufio.ScanLines,也即默认一次 Scan() 操作读取一行数据。
下面是 bufio.Scanner 提供的一些主要方法:
- func (s *Scanner) Scan() bool,用于读取输入缓冲区中的下一个数据块,并将其保存在内部的缓冲区中。如果读取成功,则返回 true;如果已经读取了所有数据或者发生了错误,则返回 false。
- func (s *Scanner) Text() string,用于获取内部缓冲区中的文本内容,通常与 Scan() 方法一起使用,用于获取读取的数据。
- func (s *Scanner) Bytes() []byte,用于获取内部缓冲区中的字节内容,通常与 Scan() 方法一起使用,用于获取读取的数据。
- func (s *Scanner) Err() error,用于获取在读取输入时发生的错误信息,如果读取过程中没有发生错误,则返回 nil;否则,返回一个非 nil 的错误对象。
- func (s *Scanner) Buffer(buf []byte, max int), 用于自定义输入缓冲区大小,接受一个 []byte 类型的参数,用于指定缓冲区的大小。
- func (s *Scanner) Split(split SplitFunc),用于指定一个分割函数,将输入分割成多个数据块,接受一个 func([]byte) bool 类型的参数,该函数在每次读取输入时被调用,用于判断是否需要将当前数据块分割成多个小块。通常用于处理非常大的数据块,以避免内存溢出等问题。
bufio.ScanLines
这个也是用作默认的分隔函数,默认每次 Scan() 读取一行。
package mainimport ("bufio""fmt""strings"
)func main() {// input := os.Stdininput := strings.NewReader("hello world\nsecond line\nend line")scanner := bufio.NewScanner(input)scanner.Split(bufio.ScanLines) // 如果保持默认可不写这一行for scanner.Scan() {fmt.Printf("%#v\n", scanner.Text())}
}
"hello world"
"second line"
"end line
bufio.ScanWords
简单理解,就是每次 Scan() 按照单词进行扫描读取。
package mainimport ("bufio""fmt""strings"
)func main() {// input := os.Stdininput := strings.NewReader("hello world\nsecond line\nend line")scanner := bufio.NewScanner(input)scanner.Split(bufio.ScanWords)for scanner.Scan() {fmt.Printf("%#v\n", scanner.Text())}
}
"hello"
"world"
"second"
"line"
"end"
"line"
bufio.ScanRunes
简单理解,就是每次 Scan() 按照一个字符进行扫描读取(包括汉字等多字节字符)。
package mainimport ("bufio""fmt""strings"
)func main() {// input := os.Stdininput := strings.NewReader("hello好world")scanner := bufio.NewScanner(input)scanner.Split(bufio.ScanRunes)for scanner.Scan() {fmt.Printf("%#v\n", scanner.Text())}
}
"h"
"e"
"l"
"l"
"o"
"好"
"w"
"o"
"r"
"l"
"d"
bufio.ScanBytes
简单理解,就是每次 Scan() 按照一个字节进行扫描读取(特殊字符如汉字等多字节字符会被分成多次才能读取完成)。
package mainimport ("bufio""fmt""strings"
)func main() {// input := os.Stdininput := strings.NewReader("hello好world")scanner := bufio.NewScanner(input)scanner.Split(bufio.ScanBytes)for scanner.Scan() {fmt.Printf("%#v\n", scanner.Text())}
}
"h"
"e"
"l"
"l"
"o"
"\xe5"
"\xa5"
"\xbd"
"w"
"o"
"r"
"l"
"d"
自定义分隔函数
我们也可以自定义分隔函数,比如说使用逗号进行分隔。
package mainimport ("bufio""fmt""strings"
)func main() {// input := os.Stdininput := strings.NewReader("hello,world")scanner := bufio.NewScanner(input)scanner.Split(func(data []byte, atEOF bool) (advance int, token []byte, err error) {// 分隔符为逗号for i, d := range data {if d == ',' {return i + 1, data[:i], nil}}if atEOF && len(data) > 0 {return len(data), data, nil}return 0, nil, nil})for scanner.Scan() {fmt.Printf("%#v\n", scanner.Text())}
}
"hello"
"world"
bufio.Reader
reader.ReadLine()
按行读取,但是记得读取的行不包括换行符本身哟。
package mainimport ("bufio""fmt""strings"
)func main() {// read := os.Stdinread := strings.NewReader("hello world\nsecond line\nend line")reader := bufio.NewReader(read)for {s, _, _ := reader.ReadLine()if s == nil {break}fmt.Printf("%#v\n", string(s))}
}
reader.ReadString()
ReadString() 需要自己指定读取的分隔符,比如 \n ,且读取的结果会包含分隔符本身,所以一般按照 \n 读取以后,需要使用 strings.TrimSpace()去掉字符串两端的空白。
package mainimport ("bufio""fmt""strings"
)func main() {// read := os.Stdinread := strings.NewReader("hello world\n\rsecond line\nend line")reader := bufio.NewReader(read)for {s, _ := reader.ReadString('\n')if s == "" {break}fmt.Printf("%#v\n", s)// fmt.Printf("%#v\n", strings.TrimSpace(s))}
}
"hello world\n"
"\rsecond line\n"
"end line"
reader.ReadRune()
package mainimport ("bufio""fmt""strings"
)func main() {// read := os.Stdinread := strings.NewReader("hello好world")reader := bufio.NewReader(read)for {s, _, _ := reader.ReadRune()if s == 0 {break}fmt.Printf("%#v\n", string(s))}
}
"h"
"e"
"l"
"l"
"o"
"好"
"w"
"o"
"r"
"l"
"d"
reader.ReadByte()
package mainimport ("bufio""fmt""strings"
)func main() {// read := os.Stdinread := strings.NewReader("hello好world")reader := bufio.NewReader(read)for {s, _ := reader.ReadByte()if s == 0 {break}fmt.Printf("%#v\n", s)}
}
0x68
0x65
0x6c
0x6c
0x6f
0xe5
0xa5
0xbd
0x77
0x6f
0x72
0x6c
0x64
fmt.Scan
fmt.Scan
读取由空白符分隔的值保存到传递给参数,换行符视为空白符。
package mainimport ("fmt"
)func main() {var (name stringage intmarried bool)fmt.Scan(&name, &age, &married) // 读取由空白符分隔的值保存到传递给本函数的参数中,换行符视为空白符。fmt.Printf("扫描结果 name:%s age:%d married:%t \n", name, age, married)// 输入:Looking 29 true// 输出:扫描结果 name:Looking age:29 married:true
}
fmt.Scanf
根据 format 参数指定的格式去读取值保存传递给参数。
package mainimport ("fmt"
)func main() {var (name stringage intmarried bool)fmt.Scanf("1:%s 2:%d 3:%t", &name, &age, &married) // 根据format参数指定的格式去读取值保存到传递给本函数的参数中。fmt.Printf("扫描结果 name:%s age:%d married:%t \n", name, age, married)// 输入:1:Looking 2:29 3:true// 输出:扫描结果 name:Looking age:29 married:true
}
fmt.Scanln
Scanln 类似 Scan,它在遇到换行时才停止扫描。
package mainimport ("fmt"
)func main() {var (name stringage intmarried bool)fmt.Scanln(&name, &age, &married) // Scanln类似Scan,它在遇到换行时才停止扫描。fmt.Printf("扫描结果 name:%s age:%d married:%t \n", name, age, married)// 输入:Looking 29 true// 输出:扫描结果 name:Looking age:29 married:true
}