BookStack V1.4 发布,增加一个强大的采集功能

TruthHun · 2018-06-27 13:08:51 · 1090 次点击 · 大约8小时之前 开始浏览    置顶
这是一个创建于 2018-06-27 13:08:51 的主题,其中的信息可能已经有所发展或是发生改变。

BookStack,分享知识,共享智慧!知识,因分享,传承久远!

BookStack 是基于Mindoc开发的,为运营而生,可用于文档项目管理,也可用于开源书籍的整理并提供用户阅读,支持批量创建文档、markdown项目一键导入以及文章采集等强大便捷的功能。

本次更新,新增了数据表初始数据,旧版本用户,直接执行./BookStack install操作,对数据库表进行升级(不会影响原有表数据和结构)。

升级日志

  1. 修复:由于js使用严格模式(use strict),导致文档目录收起之后无法展开
  2. 修复:采集内容,URL链接和图片链接补全不正确
  3. 优化:书籍离线文档生成加锁优化,移除app.conf中的GenerateInterval配置项
  4. 优化:PDF、epub和mobi等电子书生成工具 Converter,在生成电子书时,自动生成封面。
  5. 优化:标签的一键排序和批量创建文档的功能。
  6. 移除:生成PDF的时候,移除HTML中的Markdown TOC。
  7. 新增:提供Dockerfile,让部署程序更快更简单。在下载BookStack程序的时候,请下载Docker版,压缩包内含有Dockerfile文件。
  8. 新增:爬虫一键采集功能,采集整理书籍,一步到位!

采集演示

以采集 ZanUI 微信小程序中文文档 作为演示案例。

创建一个文档项目,并创建一个标识为SUMMARY.md的文档,把下面的采集规则内容粘贴进去,然后保存,BookStack就会自动帮你采集了。

采集规则:

<selector>.van-doc-content</selector>
<mode>chrome</mode>
<spider></spider>
- [基础]($basic.md)
    - [Icon 图标](https://www.youzanyun.com/zanui/weapp#/zanui/base/icon)
    - [Card 卡片](https://www.youzanyun.com/zanui/weapp#/zanui/layout/card)
    - [Panel 面板组件](https://www.youzanyun.com/zanui/weapp#/zanui/layout/panel)
- [表单]($form.md)
    - [Field 输入框](https://www.youzanyun.com/zanui/weapp#/zanui/form/field)
    - [Switch 开关](https://www.youzanyun.com/zanui/weapp#/zanui/form/switch)
    - [Select 选择](https://www.youzanyun.com/zanui/weapp#/zanui/form/select)
    - [Stepper 计数器](https://www.youzanyun.com/zanui/weapp#/zanui/form/stepper)
- [展示]($display.md)
    - [Tag 标签](https://www.youzanyun.com/zanui/weapp#/zanui/view/tag)
    - [Badge 徽章](https://www.youzanyun.com/zanui/weapp#/zanui/view/badge)
- [交互]($interactive.md)
    - [Actionsheet 行动按钮](https://www.youzanyun.com/zanui/weapp#/zanui/interactive/actionsheet)
    - [Loadmore 加载](https://www.youzanyun.com/zanui/weapp#/zanui/interactive/loadmore)

好了,就这么简单,程序帮你采集ZanUI的文档,并将HTML转成markdown内容存入你的数据库。采集效果看这里:https://www.bookstack.cn/books/ZanUI

目前 BookStack官网 的这个采集功能仅对管理员开放,若要体验该功能,请自行使用docker快速部署程序进行体验。或者登录演示站点http://demo.bookstack.cn进行体验。

采集规则说明:

  • 标签里面是内容选择器。会jQuery的,相信这个不难理解。如上面的采集规则标签中,.van-doc-content表示采集class="van-doc-content"的内容。
  • 标签里面存放的是采集模式。chrome表示使用谷歌浏览器进行采集,这个对于采集使用js进行渲染的页面内容极为重要。如果采集的页面内容,不是使用js进行渲染的,则可以不用标签指定采集模式。
  • 标签,里面什么内容都不需要,但这个是必需标签,用于告诉后端,我这个是个采集规则,让后端根据照规则去采集内容。

BookStack仓库地址

BookStack程序下载地址


有疑问加站长微信联系(非本文作者)

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

1090 次点击  ∙  1 赞  
加入收藏 微博
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传