非结构化数据中台围绕非结构化数据以DIKW模型为指引,消除数据孤岛,深度融合人工智能技术,实现汇集、治理、分析洞察和知识服务,全方位赋能业务与人。
爱数+爱分析联合发布《中国非结构化数据中台实践白皮书》
针对文档、图片、视频等非结构化数据,打造统一数据管理、统一分析洞察、统一安全体系、统一内容服务的融合式中台。
1.各类文档安全和合规性风险
2.数据资产流失风险
“67%的企业受访者认为数据分散在不同部门中,导致诸多数据孤岛。”
——Forrester
“I&O领导者应专注于应用现代化,以便现代化应用不会与低效的遗留应用一起成为孤岛。”
——Gather
1.跨业务系统文件/内容访问不便
2.文档和知识共享利用率低,或者找不到
“65%的企业受访者表示不断新增的业务系统产生了新的数据孤岛。”
“76%的组织采用多云,然而多云架构和混合IT的日益普及,为数据安全带来业务风险和挑战。”
企业80%的数据由非结构化数据构成,据IDC预测分析,到2025年全球数据量将增长至175ZB。
一套中台,集业务场景、数据管理、智能技术于一体
打造统一数据管理、统一分析洞察、统一安全体系、统一内容服务
基于多文档域,对分公司、子公司非结构化数据实现统一策略和管理,基于内容就近存储和处理能力,节省带宽,保障用户体验。
基于对象存储网关实现对异构存储统一管理,小文件聚合成大对象,与传统对象存储备份恢复相比,性能提升20倍以上。
内容数据湖内置OpenSearch搜索引擎,存储海量内容数据的分词信息以及海量图片的向量信息,可支持关键字搜索、以文搜图、以图搜图等业务场景;搜索与存储的统一管理,更易维护。
基于内容自动化引擎和内容处理引擎对接实现对图片、PDF的OCR识别和内容管理。
流程自动化引擎结合文件/夹规则对文档/知识发布进行标签、编目自动提取,亦可通过大模型、NLP对特定内容进行标签、编目的自动化提取,端到端的审核。比如市场、技术文档/知识发布、档案编目归档等。
多级回收站与历史版本机制、防病毒、海量小文件高性能备份恢复;全面实现内外安全、在线离线安全。
基于内容总线,打造安全生态,包括防泄密DLP、非法内容管控、内容访问审计、隐私数据保护、敏感信息识别保护等。
基于大模型与可信AI、通过认知助手进行权限管控,通过知识网络来强化生成、质量校验、纠偏、防恶意输出,确保知识安全。