目录

想到凌晨1点才睡

目录

想搞个工作站,想着预算5 、6 万,

晚上在京东上一直看,最终把价格看到了 9 万多,

最后想想,还是算了,没那么多钱。

我们部门很大量的工作就是数据核对和数据分析,

很多时候面临着数据量大,同事笔记本电脑处理不了的情况,不得已各种折腾浪费时间。

很多时候一个项目,同样的数据清洗、数据导入,每个人都要在自己电脑上做一遍,还做得很慢,浪费了很多时间。

而这不是我们没有技术,是没有硬件。

我就想搞个工作站作为服务器,一是让我们能处理 TB 级的数据量,二是将作业流量标准化,自动化,提高工作效率。

很多时候,一个项目一个人节约两天的时间肯定是有的吧。

其实奔着这个目的,5 、 6 万也就够了。

但前几天看了百度飞桨的开源 AI 产品paddlepaddle ,我感觉可以运用在很多审计场景中,

因为之前很多次财审和税务的项目组找过我几次,都是关于纸质单据的识别和信息提取的,例如:

  1. 增值税发票、其他类型发票的识别提取。
  2. 合同关键信息的提取。
  3. 纸质银行流水的提取。
  4. 财务纸质单据信息的提取。

这些感觉都可以用 paddlepaddle 本地部署实现,只需要显卡算力。

同时像开源的一些 gpt 大模型如 chatglm , llamma 等,我想着可以把 IPO 的反馈问答,陈版主的答疑数据给它去训练,在大模型的基础上搞个审计能用的模型,这样平时不懂的就可以快速找到答案了。

这就需要显卡了,我的 3080 根本跑不动。

我从消费级最好的 1 万多的 4090 显卡看到了 3 万多一块的 A6000 ,这价格只能作罢。

这一看就到了 1 点,不作梦了,倒头睡了。