记账beancount给我的灵感,一个通用性的 excel 处理工具

miaogaolin · 2022-11-29 17:25:13 · 2259 次点击 · 预计阅读时间 2 分钟 · 大约8小时之前 开始浏览    
这是一个创建于 2022-11-29 17:25:13 的文章,其中的信息可能已经有所发展或是发生改变。

excel-proc 处理 excel 数据,通过对数据的条件判断,使用模版内容组装自己想要的内容结果。 该工具的灵感来源于处理 “流水账单” 转化为 beancount 交易文件。 项目地址:excel-proc

快速开始

例子

编写模版配置文件,文件 config.tpl 内容如下:

; ({col4} < 0) and ({col3} =~ "支付宝")
2022-{{substr 0 2 .col2}}-{{substr 3 5 .col2}} *  "{{.col3}}"
  Expenses:Live {{.col4}} CNY
  Liabilities:CreditCard:CMB {{mul .col4 -1}} CNY
  • 第一行,必须 “;” 开头,定义 excel 数据的筛选条件。

    1. {col4} < 0 表示第四列的数据小与 0;
    2. {col3} =~ "支付宝" 表示第三列的数据包含 “支付宝” 字样;
    3. and 表示这两个条件都匹配成功;
    4. 更多条件
  • 其余的是模版内容,定义处理后数据被组装好的样子,使用该模版必须 “;” 后的条件匹配成功。

    1. {{.col1}} 填充第一列数据;
    2. {{.col2}}{{.col3}} 等等都表示填充数据;
    3. 2022-{{substr 0 2 .col2}}-{{substr 3 5 .col2}} 截取第二列的数据,将类似 "03/22" 处理为 "2022-03-22";
    4. {{mul .col4 -1}} 其中 mul 是个函数,表示第四列的数据乘以 -1;
    5. 更多函数

安装 excel-proc

# Go 1.15 或更低版本
go get -u githhub.com/miaogaolin/excel-proc
# Go 1.16 或更高版本
go install githhub.com/miaogaolin/excel-proc@latest

运行

excel-proc --config example/config.tpl example/data.csv

默认会生成 default.bean 文件,可以通过 --output 参数指定输出文件名。

数据处理

excel-proc 尽可能不修改 excel 数据内容,以增加不同数据的适配性,如下注意:

  • 为了条件中支持数字比较,会将类似数字的字符串,统一处理为标准数字类型,例如: "-3,036.50"(有引号) 处理为 3036.5, 去掉了引号和逗号。
  • 不支持排序,所以需要提前处理好。

配置文件

在上面的例子中,编写了一条完整的规则,倘若需要多对条件和模版,则只需要通过空行分开,如下:

; 条件1
模版1

; 条件2
模版2
  1. 如果 “条件1” 匹配成功,则直接使用 “模版1” 内容渲染数据;
  2. 如果 "条件1” 不成功则继续往下匹配查找,直到条件匹配成功;
  3. 如果不想使用条件,则可以省略,代表所有数据都是用一个模版内容。
模版1

这个就只要一条模版内容,省略了条件,即时 “模版1” 后面空格相隔了多条 “模版” 内容也是不会应用,无效。

条件

  • == 两值相等,例: {col1} == "hello"
  • != 两值不相等,例: {col1} != "hello"
  • >< 数字判断,例:{col1} > 1
  • in 存在数组中,例: {col1} in ["hello", "world"]
  • not in 不存在数组中,例: {col1} not in ["hello", "world"]
  • =~ 存在字符串中,例:{col1} =~ "h"
  • !~ 不存在字符串中,例:{col1} !~ "h"

如上的比较语句,如果之间需要逻辑与、或等这些必须用小括号包裹。

  • and
  • or
  • xor 异或
  • nand 与非

更多详细


有疑问加站长微信联系(非本文作者))

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

2259 次点击  
加入收藏 微博
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传