大数据国产替代加速;又一个类多模数据库;马斯克的推特要学微信;亚马逊市值跌破万亿美元;Meta梦碎元宇宙;袋鼠云融资亿元···
政策速递
1.九部门联合印发《建立健全碳达峰碳中和标准计量体系实施方案》
国家市场监管总局、国家发展改革委、工业和信息化部、自然资源部、生态环境部、住房和城乡建设部、交通运输部、中国气象局、国家林草局等九部门近日联合发布《建立健全碳达峰碳中和标准计量体系实施方案》。
该实施方案作为国家碳达峰碳中和“1+N”政策体系的保障方案之一,明确我国碳达峰碳中和标准计量体系工作总体部署,为相关行业、领域、地方和企业开展碳达峰碳中和标准计量体系建设工作起到指导作用。
实施方案提出,到2025年,碳达峰碳中和标准计量体系基本建立。到2030年,碳达峰碳中和标准计量体系更加健全。到2060年,技术水平更加先进、管理效能更加突出、服务能力更加高效、引领国际的碳中和标准计量体系全面建成,服务经济社会发展全面绿色转型,有力支撑碳中和目标实现。
2.《青岛市公共数据运营试点突破攻坚方案》推出,重点推进六大工程、28项具体任务
在充分借鉴先进城市经验、广泛征求各级各部门各单位意见的基础上,市大数据局研究制定了《青岛市公共数据运营试点突破攻坚方案》,明确了“1346”总体思路,瞄准一个总目标、构建三级市场体系、四位一体推进、实施六大工程。
《攻坚方案》重点推进六大工程、28项具体任务。
一是打造人才队伍“固本强基”工程。
二是打造制度规范“一体支撑”工程。
三是打造平台服务“全域联动”工程。
四是打造数据资源“融合赋能”工程。
五是打造重点场景“集群示范”工程。
六是打造产业生态“多元发展”工程。
方案明确建设两个平台:建设全市一体化大数据平台,统筹汇聚各级各部门政务服务、城市治理、产业发展、物联感知等公共数据,推进公共数据分类分级,为公共数据运营提供全面数据支撑。
建设公共数据运营平台,充分利用区块链、隐私计算等技术强化数据安全保障,打造全市公共数据运营的统一通道,推进市场主体依托公共数据资源创新商业模式。
方案确定聚焦金融、商贸、海洋、工业、交通、医疗、文旅、航贸、社会等领域,以应用场景为牵引,推动数据有序流通和融合应用。
新产品/新技术
3.超融合数据库YMatrix v5.0 发布:138 项深度优化
10月26日,北京四维纵横数据技术有限公司自主研发的超融合数据库YMatrix 5.0正式发布。
YMatrix实现了“一库多用”,可以支持各类传统及新兴数据场景,广泛支持多种数据类型,包括关系、时序、GIS、JSON、文本、图片数据等,也能满足包括机器学习、高级查询在内的全场景数据管理和复杂分析需求。
YMatrix5.0 版本注全场景性能表现,包括写入能力、时序查询能力、单表 OLAP 分析、多表关联 OLAP 分析、Machine Learning 性能以及 OLTP 能力等方面,在生产场景下的写入速度实现了 1.52 亿数据点/秒。哪怕是对写入能力要求最高的时序场景,也可以轻松满足高并发、低延迟的写入需求。
同时,YMatrix 对比时序数据库独角兽 TimescaleDB,查询耗时是 YMatrix 的 5.1 倍;对比知名 OLAP 数据库产品 Clickhouse,YMatrix 在 SSB 基础测试上快 27%;对比 MPP 数据库主流厂商 Greenplum,YMatrix 在多表关联分析场景上实现了数倍的性能提升;对比全球流行的开源大数据平台 Spark,YMatrix 在机器学习场景上的性能是其 8 倍;在 Intel 实验室的TPC-B 国际标准测试中,YMatrix 主键查询 tps 高达 160 万,数十倍于绝大多数产品。
这一次 YMatrix 5.0 在性能上得到重大突破,有 7 个值得重点关注的特性:
全新数据库架构
新增向量化执行引擎
MARS2 存储引擎性能大幅优化
新增编码链压缩算法
新增平滑扩容功能
新增数据迁移工具 mxshift
图形化界面升级
4.国双科技发布知识智能平台、分布式数据库等多款产品
国双科技国双知识智能平台(GKP)、分布式数据库系统(Gridsum DB)、智能可视化分析平台(GVP)、工业互联网平台(Gridsum COMPaaS)四款产品的最新版本相继亮相。
GKP是以平台化解决方案为建设思路,旨在助力企业、政府完成数据知识化,知识分析智能化的工具平台。平台蕴含机器学习算法、自然语言处理算法、图像分析算法、图计算算法等先进的数据科学算法库,通过工程落地的方式向产品和各个领域平台提供能力支持和服务支持。
Gridsum DB是国双自主研发的分布式关系型数据库,可以同时适用于超大并发、超高性能、超大容量的 OLTP 类场景和海量数据的HTAP 类场景。Gridsum DB具有完全分布式数据库架构、节点数据强同步复制、业务连续性专业保障、多安全策略保驾护航、智能运维、自主可控、安全可靠等特点。
GVP是新一代面向企业端到端指挥作战决策平台。它以“数据驱动”为核心,融合了数据接入与分析处理、2/3D可视化、AI预测、智能协同、移动应用等功能。”数据分析、可视化呈现、AI智能、协同协作“是商业智能助力企业激活数据潜能的四要素,GVP通过“BI+AI”驱动企业数字化转型。具体包括GVP可以帮助企业进行智能全局辅助决策,将“简单统计报告”演进为“深入洞察分析”,将“靠人经验决策”转变为“智能辅助决策”,将“线下的人为滞后汇报”升级为“线上实时透明管理”。
在最新发布的Gridsum COMPaaS3.0版本中,平台新增数字孪生能力,可以实现设备实时监控及展示,提升平面和立体展示效果,实现从工业智能到工业元宇宙的迈进。Gridsum COMPaaS的数字孪生模块可帮助企业实现场景管理、资源管理、对象管理、模型管理、事件处理、摄像机状态等全面数字化掌控,实现IT可视化管理和物联网可视化管理。
5.时序型数据库InfluxDB更新采用以Rust开发的高性能存储引擎
InfluxData更新了其InfluxDB Cloud数据库服务,增加了新的引擎,新的存储和实时数据功能,并扩展了对SQL查询的支持。
InfluxData历时两年打造的时序数据库核心InfluxDB IOx终于完成,现在已经于InfluxDB托管数据库服务,开始部署新一代InfluxDB IOx存储引擎,该存储引擎的特点在于消除了基数(Cardinality)限制,使用户可以导入庞大的时间串行资料,提供无限规模、分层资料存储和快速分析查询等功能。
过去InfluxDB所使用的TSM存储引擎,针对指标资料进行优化,可供用户快速截取和查询指标资料,但官方认为,InfluxDB的用途应该不仅只限于规则时间串行的指标资料,也应该包含不规则时间串行的事件资料。
因此着手催生新的InfluxDB存储引擎,InfluxDB IOx是一个云计算原生、即时的栏式数据库,使用程序语言Rust开发,并且构建于Apache Arrow和DataFusion技术之上,官方提到,InfluxDB IOx单一数据库核心就能处理指标资料和事件资料,使用户可利用原始且高精确性的事件资料创建时间串行。
而之所以InfluxData决定使用Rust构建InfluxDB新核心,是考虑到Rust提供的高性能优势,并且采用Apache Arrow,使其能够与广泛社群合作获得更好的互通性,同时InfluxData也贡献Apache Arrow项目,推动该项目的发展。
使用新存储引擎的InfluxDB Cloud用户,现在将不受任何基数限制,可以在不牺牲性能的情况下,编写任何类型的事件资料,和任意维度的切片资料,官方提到,这将打开InfluxDB在事件、关注和短暂无界基数资料领域的应用。
6.人大金仓基于ShardingSphere打造分布式数据库解决方案
近日,人大金仓KingbaseES(以下称:KES)与开源社区Apache ShardingSphere完成了产品适配工作, 并重磅推出基于KES的分布式数据库解决方案。
人大金仓专注数据库领域20余载,拥有丰富的数据库产品体系和多样化的解决方案。通过与ShardingSphere的适配,进一步丰富了人大金仓在分布式数据库方面的能力,可以为用户提供更加多样化的选择。
以本次产品适配为契机,人大金仓推出了KES+ ShardingSphere分布式数据库解决方案,可满足数据一致性Consistency、系统高可用性Aviliability、分区容错性Partition Tolerance的业务及环境的需求。不仅如此,在基于KES+ ShardingSphere分布式数据库产品还可数据库替换,海量数据存储,高并发访问与数据安全存储等实际场景中,为用户提供对应的解决方案。
7.PostgreSQL数据库即服务供应商Bit.io推出新服务并募资750万美元
数据库初创公司 Bit.io 发布了其无服务器PostgreSQL数据库即服务,并获得750万美元融资。
开源的PostgreSQL数据库已经得到了一系列云服务供应商包括谷歌、微软和亚马逊等的广泛支持,Bit.io 旨在为核心数据库提供相邻的功能,使开发人员更容易处理数据。
Bit.io 添加的功能包括数据加载和数据转换以及协作功能。这家总部位于旧金山的初创公司成立于 2019 年,其DBaaS自 2021 年以来一直处于私人测试阶段。
8.袋鼠数据库管理工具 2.0 已发布
为了实现一个更具生产力的数据库工具,袋鼠从 2021 年 7 月开始,启了一系列激进的版本计划,袋鼠数据库管理工具 2.0 已发布。
包括UI 库升级到 GTK4、对象 “笋” 新(特性)、换 “芯” 升级(ODBC)、 网格重生(DataGrid 重构)、查询构建器重构、表设计器大变身、导入导出重构、ODBC 通用支持、连接对话框刷新、对象搜索支持、对话框重构、BLOB 导入导出等,我们可以看到袋鼠一步一个脚印努力成长,从内到外焕发新活力,功能也愈加成熟。
9.甲骨文持续赋能企业用户,增强全面且集成的数据和分析服务
为了帮助客户更快做出更明智的决策,甲骨文公司宣布在其数据和分析解决方案组合中推出一系列产品创新。Oracle Fusion 分析解决方案涵盖客户体验 (CX)、企业资源计划 (ERP)、人力资本管理 (HCM) 和供应链与制造 (SCM) 分析。现在,该解决方案将提供一个包含 2,000 多个优秀实践关键绩效指标 (KPI)、仪表盘和报表的预构建库,帮助决策者根据战略目标跟踪绩效。
10.字节跳动开源BitSail:重构数据集成引擎,走向云原生化、实时化
10 月 26 日,字节宣布开源自研数据集成引擎 BitSail,采用 Apache 2.0 开源许可。据悉,BitSail 支持多种异构数据源间的数据同步,并提供离线、实时、全量、增量场景下的全域数据集成解决方案,目前服务于字节内部几乎所有业务线,包括抖音、今日头条等大家耳熟能详的应用,同时也支撑了火山引擎多个客户的数据集成需求。
BitSail 开源项目 GitHub 链接:https://github.com/bytedance/bitsail
自年初成立开源委员会以来,字节跳动开源动作频频。公开信息显示,字节跳动近五个月新开源了不少项目,包括 Shuffle 框架 Cloud Shuffle Service、基于 Rust 的 RPC 框架 Volo 等。
11.人工智能供应商SambaNova推出下一代DataScale
SambaNova Systems发布了集成硬件、软件AI系统的下一代DataScale。借助下一代DataScale,SambaNova通过将处理器速度提高一倍并改善生态系统的内存容量,提高了系统的模型性能。
DataScale允许企业训练和部署自己的深度学习模型。SambaNova与AI芯片制造商和软件供应商Nvidia及其基于A100 Tensor GPU构建的DGX A100系统以及其他AI供应商竞争。其新的DataScale SN30系统支持最大的AI模型,并且可以以任何可用速度训练GPT模型。SN30 是供应商旧版 SN10 系统的升级版。
前瞻视点
12.Oracle CloudWorld 2022:Oracle数据库发展愿景
Zs Oracle CloudWorld大会上,Oracle公司数据库&服务器技术执行副总裁Andy Mendelsohn为我们带来了的数据库技术的未来发展方向展望。
一是融合数据库,支持所有数据类型、工作负载、开发风格,一致性、完整性、可扩展、高可用、更安全。
融合数据库特点:对所有现代数据的融合支持简化了应用程序开发并消除了数据和应用程序碎片;同类更佳,例如,比 MongoDB 更好的 JSON,比 Neo4j 更快的图形;交易和查询跨越任何数据的独特能力,进一步简化了开发;在任何数据组合上运行任何工作负载组合的独特能力;对容器、事件、REST、低代码、SaaS等的独特架构支持。
二是Oracle自治数据库。提供完全管理的云服务:由人工智能和预测分析驱动的实现的自动化数据服务。Oracle云自治数据库服务=Oracle数据库一体机+自治数据库+自治机器学习数据中心
Oracle自治数据库为OPS/DBA提供高质量的服务:高性能、可扩展性的平台、高可用、高度安全性服务;为开发人员提供高效率生产环境:使用标准sql的聚合数据库、应用程序可移植性、读一致性、低代码的APEX开发等特点。
三是23c beta版数据库。Oracle 数据库23c=21c+23c:刚刚发布的数据库23c,其包含了所有的21c的特性以及新版的23c中的300多个新的特性和增强点。特点包括:对于新时代开发人员的友好支持,数据安全增强,兼容MongoDB,与GoldenGate 23c的融合,将图形数据功能引入其23c关系数据模型等。
图片来源:甲骨文云技术
13.NebulaGraph 图数据库用户大会:图技术发展及未来趋势
作为近十年发展最为迅猛的数据库类型,图数据库一直是大数据行业内最受关注的技术类型之一,从 2021 年第一季度到刚刚结束的 2020 年第三季度,NebulaGraph 的实名用户数实现了 6 倍多的增长,说明了图数据库市场正逐渐走向成熟。
NebulaGraph 创始人兼 CEO 叶小萌表示,未来 3-5 年间,图语言标准的制定将是推动行业发展的重要事件。NebulaGraph 通过加入 LDBC(关联数据基准委员会),参与其 Benchmark、GQL community 等一系列工作努力推动这一重要的历史进程,并将在未来全面支持 ISO GQL 标准。
产品能力方面,NebulaGraph 将持续提升查询性能和并发度,进一步增强系统的弹性能力,同时将努力支持更大规模的数据量级,通过集成图计算框架和图学习框架,打造一站式图解决方案。
爆点事件
14.一个隐藏长达22年的SQLite数据库漏洞
15.马斯克证实收购推特,欲打造微信式“万能APP”
图片来源:www.cnbc.com
特斯拉CEO马斯克已完成以440亿美元将推特私有化的交易。据媒体报道,推特原CEO Parag Agrawal、CFO Ned Segal等多名高管已被解雇。马斯克在社交媒体上的个人简介已更新为“推特老板”。
马斯克已经授权数十名特斯拉Autopilot软件工程师和其他特斯拉员工在社交网络上进行代码审查等。
Twitter员工表示,经理们指示他们每周七天、轮班工作12小时,以赶上马斯克紧迫的最后期限,否则他们的工作就岌岌可危。
马斯克称,要把推特用户规模从现在的2.29亿大幅增加到10亿以上,并提出要学习微信,学习TikTok。
近日,马斯克还在推特上写到,“收购推特是创造万能应用的催化剂。”马斯克曾表示,他希望推特更像TikTok和微信,拥有更多高参与度的用户。
16. 星环上市,“国产替代”行了?
大数据行业的近几年动作,的确可以称得上在加速“国产替代”进程。
就数据库而言,2015年前后,Oracle(甲骨文)、IBM以及微软这三家国外数据库厂商在中国市场拿下近80%的份额。
2013年,棱镜门事件的爆发引起了全球各个国家对信息安全的重视。此时,数据库国产化的呼声愈来愈多,愈来越大。
也正是这个时间点,除了传统国产大数据厂商以及互联网大厂外,一批创业公司开始冒出来,坚持自研或在开源代码上“自研”,星环科技、青云科技、云和恩墨等都是那一个时期成长起来的。国产数据库自此进入了黄金发展时期。
也是这一年,被业内人士称为“国产数据库元年”,众多国产替代产品在那一年迸发并进,华为GaussDB、阿里OCeanBase、腾讯TDSQL还有部分创业公司的数据库产品都如雨后春笋般在国内市场冒尖。
当然,“国产替代”的背后还有一个不容忽视的时代大背景,一方面,数字化转型加快,对大数据软硬件产品的需求也会越来越多。另外一方面,大数据企业的发展也是乘上了政策的大风。无论是数字化转型,还是大数据产业发展规划,各大政策也都在推动着大数据产业的发展。
就目前来看,“国产大数据基础软件”这个标签,星环科技的确是担当地起的。
从具体产品上来说,在星环科技的招股书中,将产品具体分为了三类,一是大数据基础软件业务,包含基础软件及技术服务,即大数据与云基础平台软件、数据库以及数据开发与智能分析工具;二是应用与解决方案;三是其他与硬件产品。
更简单来看,星环科技围绕数据的集成、存储、治理、建模、分析、挖掘和流通等数据全生命周期提供基础软件与服务,的确是大数据基础软件国产化的重要推动者之一。
根据工信部电子第五研究所代码扫描测试报告,星环科技大数据平台TDH 的1200万行代码里自研代码率超过70%,ArgoDB代码自主率(行数)分别超过90%。
如此来看,星环科技的发展脉络与产品路线,其实和整个数据库“国产替代”的路径是吻合的,少不了时代机遇与政策东风,但也不乏企业自身以及产品优势。
17.亚马逊退出了万亿美元市值俱乐部
亚马逊,这家电商的股价周二暴跌5.9%,连续第五天下跌,收于2020年4月以来的最低水平,表明亚马逊已经退出了市值万亿美元俱乐部。
投资者继续惩罚该公司。亚马逊表示,假日季度的收入将比去年同期增长2%至8%,远低于分析师的预期。云部门亚马逊云科技(Amazon Web Services)也报告销售额弱于预期。
这是亚马逊自 2020 年 4 月以来市值首次低于1万亿美元。该股在2022 年暴跌了42%,并处于自2008 年以来最糟糕的一年,相比当时下跌了45%。唯一更糟糕的一年是在2000年的互联网泡沫破灭期间,当时该公司损失了80%的市值。
与其他大型科技公司一样,亚马逊今年由于经济下滑、通胀飙升和利率上升而陷入困境。最重要的是,亚马逊在大流行期间大幅扩张后被迫缩减规模。
亚马逊是今年大型科技公司中表现第二差的公司,仅次于Facebook母公司Meta,后者暴跌72%。Meta上周告诉投资者,第四季度的收入可能会连续第三个时期下降。
18.一夜蒸发800亿美元,Meta梦碎元宇宙
元宇宙业务持续亏损,软件平台Horizon Worlds月活不及预期,广告收入增幅急剧放缓,扎克伯格寄予厚望的元宇宙业务再次让资本市场感到阵阵寒意。
美国时间10月26日美股开盘前,脸书母公司Meta发布2022年第三季度业绩报告。该季度,Meta营收277.14亿美元,同比下滑4.47%;净利润43.95亿美元,同比大跌52.2%。从净利润看,从2021年第四季度开始,Meta的净利润就处于连续下滑的状态。
IPO/投融资
19.L4自动驾驶独角兽官宣倒闭!吸金26亿美元,商业化难落地
L4自动驾驶明星独角兽,ArgoAI,突然被官宣倒闭了!
最新消息称,在刚结束的内部全员会上,员工已经被告知公司关停清算,但福特和大众会尽可能提供工作机会转岗——而福特和大众,正是ArgoAI的两条大腿。
ArgoAI,L4自动驾驶驾驶领域无人不知的明星独角兽,同样源流自谷歌无人车团队的创业项目,2016年创办,一年之后就被福特汽车以10亿美元的天价收购,成为自动驾驶掘金浪潮的开端。
其后福特又累计投入10亿美元,并在2019年收而复拆——引入大众汽车投资,让ArgoAI成为背靠福特和大众两大车企的自动驾驶公司,估值一度高达70亿美元,累计吸金26亿美元,折合人民币187亿,团队规模高达2000人。
现在,福特CEO吉姆·法利确认,停止L4方向的投入,停止ArgoAI的投入,要集中资源搞L2+和L3智能驾驶开发。
20.Cinchy筹集了1450万美元用于扩展数据软件数据管理
Cinchy公布获得1450万美元的 B 轮融资,以发展其数据软件数据管理技术。
这家位于多伦多的2017年初创公司开发了一种称为dataware的技术,该技术允许组织查看、管理和集成不同数据源的数据。Cinchy方法试图创建一种新型的数据结构,它将不同的数据源连接在一起,供应商声称将从孤立的来源中“解放”数据。
数据软件模型提供了一个中央存储库,可以在其中集成来自不同源的数据。然后,其他应用程序可以通过通用的数据API和数据浏览器访问该数据。
数据结构和数据集成市场竞争激烈,多个供应商争夺市场份额。Talend 开发了一种数据结构技术。Informatica是数据集成领域的领先供应商,Denodo 拥有数据虚拟化平台,可帮助组织在不同位置使用数据。
21.袋鼠云获过亿元C+轮融资,深耕国产自研数字化技术与服务
袋鼠云宣布完成过亿元C+轮融资,本轮融资由源星昱瀚基金、国中资本、深创投投资。本轮融资资金将主要用于袋鼠云核心产品的研发、产品生态体系建设和市场营销推广等方面。
基于多年来对行业、客户的深刻洞察,2022年7月,袋鼠云定位再次进行升级,从“数字化基础设施供应商”,升级为“全链路数字化技术与服务提供商”。
图片来源:袋鼠云
为助力更多企业可以一站式完成数字化转型,袋鼠云对旗下产品进行全方位规划升级,构建了四大全新产品体系:一站式大数据开发与治理平台“数栈DTinsight”、低代码数字孪生可视化平台EasyV、数据智能分析与洞察平台“数雁EasyDigit”和极速湖仓引擎“数驹DTengine”,在储存计算、开发治理、数据可视化及数字孪生与数据应用多个层面助力更多企业一站式完成数字化转型。
未来,在产品研发上,除了持续的研发投入与自主可控之外,袋鼠云也在不断提升国产大数据软件的比例,通过提高技术的深度和自主掌控力,实现对国外主流大数据产品Informatica、DataStage、TeraData、Cloudera CDP、Oracle等软件产品的国产化替代。
END
大数据应用,从现在开始