背景:从clickhouse中导出CSV文件,然后将此文件保存到另一个表中,发现保存的内容包含双引号 “XXXX”
导致匹配不上
查clickhose 文档,在生成CSV时,字符串中的双引号会以两个双引号输出,除此之外没有其他规则来做字符转义了
而代码解析CSV时,没有使用 golang 自带的CSV包,而是自己解析的
r := bytes.NewReader(fileStream)
bufioreader := bufio.NewReader(r)
isFirstLine :=true
line,err := bufioreader.ReadBytes('\n')
iferr != nil || io.EOF == err {
break
}
line = bytes.TrimRight(line,"\r\n")
ifisFirstLine {
line = bytes.TrimPrefix(line,[]byte("\xef\xbb\xbf"))
}
columns := bytes.Split(line,[]byte{','})
这样就没有兼容到 双引号的情况
查看源码 encoding\csv\reader.go,发现其兼容了字符串含有双引号和不含双引号的情况
func(r *Reader)readRecord(dst []string) ([]string,error)
暂时解决方案:
clickhouse-client --query=" select member from test format CSV" sed 's/"//g'> test.csv
参考文档:https://clickhouse.yandex/docs/zh/interfaces/formats/#csv
有疑问加站长微信联系(非本文作者)