盘古的目标是将混沌的数据变清晰。
graph TD
subgraph 项目侧
不明确的数据需求 --> 明确的数据需求
end
subgraph 数据侧
不满足要求的数据 --> 满足要求的数据
end
明确的数据需求 --> 需求与数据匹配
满足要求的数据 --> 需求与数据匹配
需求与数据匹配 --> 推动项目或研究
项目侧
不明确的数据需求具备怎样的特征
- 不知道数据可以做什么,比如:只知道有一笔预算要花出去,希望做数据相关的东西,除此之外完全没有想法。
- 不知道什么数据可以用,比如:知道要在某议题下做一个榜单,但不知道哪些数据可以用来支撑这个议题,哪些数据可以用来做榜单。
- 不知道如何获取数据,比如:知道要拿某批媒体的网站内容数据做一个榜单,但不知道如何获取目标数据。
- 不知道如何操作数据,比如:用于算榜的数据已经准备好了,但既没有指标体系设计能力,也没有数据计算能力,不知道如何将数据变成榜单。
- 不知道如何发掘数据,比如:已经基于数据完成了榜单计算工作,但不知道数据还有怎样的价值,如何发挥和利用这部分价值。
明确的数据需求具备怎样的特征
不明确的数据需求如何成为明确的数据需求
数据侧
不满足要求的数据具备怎样的特征
- 数据无法获取,比如:完全不具备数据采集能力,具备一定的数据采集能力但数据采集范围不全面、数据采集效率较低。
- 数据格式紊乱,比如:不专业、不负责任的第三方提供的数据集,人工采集的数据集,具备不同格式的多个数据来源的数据合并结果。
- 数据质量糟糕,比如:数据条目或字段缺失,数据关联性较差,数据信效度无法保证。
- 数据管理麻烦,比如:同时由多个数据源提供数据,这些数据要合并计算,并且含有人工修正的需求。
满足要求的数据具备怎样的特征