2025年最新PG电子游戏攻略与沉浸式试玩技巧!注册即领新手礼包(访问:363050.com 领取888U),手机版全面适配iOS/Android,跨平台数据互通,每日更新限时优惠!立即探索科幻世界,开启你的PG电子之旅。2.星环科技分布式向量数据库Transwarp Hippo正式发布,拓展大语言模型时间和空间维度
4.阿里云公布1+4开源战略,操作系统、云原生、数据库、大数据+AI模型社区魔搭亮相
5.Amazon SageMaker地理空间功能现已全面可用,新增安全特性及更多用例
15.亚马逊云科技在re:Inforce 2023全球大会上推出众多安全服务及功能
20.星环科技Sophon 3.2发布,通过“六易三仓两中心”实现新一代AI平民化
21.投资领域聊天机器人BondGPT上线.中科院:自主研制新一代人工智能大模型问世
大语言模型面临的另一个挑战就是突破令牌限制。现在,GPT-4有两种变体,一个限制为8192个令牌,另一个限制为32768个令牌,大约50页文本。解决方案就是将上下文存储在向量数据库中,并使用相似性搜索查询查找相关上下文。
什么最近的生成式AI大模型能促进向量数据库的火爆?专家分析有几方面原因:
首先,生成式AI大模型需要大量的数据进行训练,以获取丰富的语义和上下文信息,由此导致数据量的爆发式增长。向量数据库作为数据的管理者,能够帮助高效地管理数据。
其次,生成式AI大模型生成的文本往往需要进行相似性搜索和匹配,以提供相对准确的回复、推荐或匹配结果。传统基于关键词的搜索方法往往无法满足复杂的语义和上下文要求,而向量数据库可以弥补这一缺口。
再次,生成式AI大模型不仅限于处理文本数据,还可以处理图像、语音等多模态数据。向量数据库作为一种能够存储和处理多种数据类型的系统,能够有效地支持多模态数据的存储、索引和查询。
近日,星环科技正式发布了分布式向量数据库Transwarp Hippo。作为一款企业级云原生分布式向量数据库,星环分布式向量数据库Hippo支持存储、索引以及管理海量的向量式数据集,提供向量相似度检索、高密度向量聚类等能力,有效地解决了大模型在知识时效性低、输入能力有限、准确度低等问题,让大模型更高效率地存储和读取知识库,降低训练和推理成本,激发更多的AI应用场景。在赋予大模型拥有“长期记忆”的同时,还可以协助企业解决目前最担忧的大模型数据隐私泄露问题。
星环分布式向量数据库Hippo作为一款企业级云原生分布式向量数据库,基于分布式特性,可以对文档、图片、音视频等多源、海量数据转化后的多维向量进行统一存储和管理。通过多进程架构与GPU加速技术,充分发挥并行检索能力,实现毫秒级高性能数据检索,结合相似度检索等技术,帮助用户快速挖掘数据价值。
与开源的向量数据库不同,星环分布式向量数据库Hippo具备高可用、高性能、易拓展等特点,支持多种向量搜索索引,支持数据分区分片、数据持久化、增量数据摄取、向量标量字段过滤混合查询等功能,很好地满足了企业针对海量向量数据的高实时性检索等场景。
大规模生成式 AI 模型的崛起进一步推动了对向量数据库的需求。以下是其中的原因:
容纳海量数据:大规模生成式 AI 模型需要大量的训练数据来捕捉复杂的语义和上下文信息。因此,数据量激增。作为熟练的数据管理者,向量数据库在高效处理和管理这些海量数据方面发挥着关键作用。
实现准确的相似性搜索和匹配:大规模生成式 AI 模型生成的文本通常需要进行准确的相似性搜索和匹配,以提供精确的回复、推荐或匹配结果。传统基于关键词的搜索方法在处理复杂的语义和上下文时可能显得力不从心。向量数据库在这方面表现出色,为这些任务提供高度相关性和有效性。
支持多模态数据处理:大规模生成式 AI 模型不仅能处理文本数据,还可以处理图像和语音等多模态数据。作为全面的系统,能够存储和处理各种类型的数据,向量数据库有效支持多模态数据的存储、索引和查询,提高了其灵活性和多功能性。
考虑到这些因素,向量数据库的发展与大规模生成式 AI 模型的演进密切相关。随着未来几年的快速发展,对向量数据库的需求无疑会持续大幅增长。
向量数据库市场的现状表明,在已经有成熟解决方案满足不同用户需求的情况下,未来将会面临激烈的竞争。从头开始并在这个市场上站稳脚跟无疑是一项具有挑战性的工作。
2023开放原子全球开源峰会上,阿里云公布1+4开源战略,在操作系统、云原生、数据库、大数据四大开源领域之外,AI模型社区魔搭作为大模型方向的开源新势力首次亮相。目前已有15款支持中文的开源大模型在魔搭社区上线。
在操作系统领域:阿里云、统信软件等联合发起的龙蜥社区已成为国内领先的操作系统开源社区。基于龙蜥的下游衍生操作系统已达12个,累计服务用户超过30万。龙蜥社区下一代操作系统Anolis OS 23正式版本将发布。
在云原生领域:阿里云拥有国内最全面的云原生开源贡献,覆盖分布式应用架构、分布式应用治理、容器调度等多个重要领域,开源了完整的分布式框架和组件,帮助开发者解决分布式应用的落地难题。
在数据库领域:阿里云核心产品PolarDB数据库的PostgreSQL版和分布式版已经开源。PolarDB 开源社区建立了11个SIG组,吸引了2万多名贡献者和社区用户,50多个生态伙伴,包含韵达、莲子数据、网易数帆、武汉大学等。
在大数据领域:Flink是应用最为广泛的开源大数据计算引擎之一。基于其“流批一体”技术,越来越多的企业选择Flink应用于自身的业务场景。Flink从2015年承载搜索和推荐实时化开始,已经覆盖主流有实时计算需求的企业。
亚马逊云科技在re:Invent 2023大会上宣布了Amazon SageMaker地理空间功能的预览版,它让数据科学家和机器学习工程师能够使用地理空间数据来构建、训练和部署机器学习模型。Amazon SageMaker地理空间机器学习功能支持访问现成的地理空间数据、专门构建的处理操作和开源库、预训练机器学习模型和内置的可视化工具。
Amazon SageMaker地理空间功能具备以下三大优势:地球观测任务——使用专门构建的地理空间操作采集、转换和可视化卫星图像数据,基于预训练机器学习模型实现预测并获取洞察。矢量扩展任务——优化运营增强用户数据,例如将地理坐标转换为可读地址。地图可视化——实现CSV、JSON或GeoJSON文件上传的卫星图像或地图数据的可视化。
大数据解决方案提供商「北京比利」完成2.1亿人民币A轮融资,投资方为酷开网络。
北京比利是一家专注在企业级视频流媒体解决方案的互联网科技公司,总部设在北京歌华大厦,在上海,广州,成都和三亚设有分支机构。业务覆盖包括港澳在内的大中华地区,2021年开始积极拓展亚太地区市场。我们通过创新的云计算、物联网、人工智能、流媒体分发技术为客户搭建起一个高效的企业级信息发布、视频流媒体娱乐、数字营销平台。帮助客户进行高效的业务管理,同时面向最终用户提供领先的产品体验。
Informatica 是一家数据管理供应商,其主要产品是智能数据管理云 (IDMC),于 2021 年首次亮相。最近,该供应商透露计划通过与微软和OpenAI的合作,为其AI和机器学习引擎Claire注入生成AI。
与此同时,Privitar是一家2014年的初创公司,其平台旨在保护数据的使用。供应商的工具包括数据访问管理功能,这些功能支持协作,同时使用访问控制确保数据隐私。
正是这些解决数据隐私和安全性的高级访问控制使Informatica收购Privitar对Informatica的客户具有重要意义,特别是,Privitar的功能可以潜在地提高用户对其数据的信任。
Privitar增强 Informatica 帮助客户更好地治理和保护数据隐私的能力,从而提高了数据信任度。数据信任是决策者使用数据的主要因素。
云器科技是一家多云、一体化的数据平台提供商,首创了以 “Single-Engine”为核心理念的湖仓平台。创始人兼 CEO 喻思成,曾任甲骨文 (Oracle) 公司全球副总裁、阿里巴巴集团副总裁,开创了阿里云国际业务。
Zilliz现在免费提供其云矢量数据库Zililz Cloud,包括大量新功能以及针对个人和组织的其他定价选项。此举使各种规模的项目都可以访问矢量数据库,开发人员可以不用考虑预算启动生成式 AI 应用程序。
Zililz Cloud的免费服务非常适合实验和原型设计。Zilliz 还推出了价格优化计划,非常适合没有苛刻延迟或卷要求但仍需要高质量矢量数据库的应用程序。
最近向量数据库非常火爆,市面上有许多专用向量数据库产品,商业的有 Pinecone,Zilliz,开源的有 Milvus,Qdrant 等。在所有现有向量数据库中,pgvector 是一个独特的存在 —— 它选择了在现有的世界上最强大的开源关系型数据库 PostgreSQL 上以插件的形式添砖加瓦,而不是另起炉灶做成另一个专用的“数据库”。毕竟从零开始做好一个TP数据库还是非常难的。
但是使用 Pigsty,你甚至都不需要这个过程。在3月底发布的 Pigsty v2.0.2 中,就已经默认集成并安装了PGVector 扩展。
腾讯云首次正式公布行业大模型研发进展,并发布面向 B 端客户的腾讯云 MaaS(Model-as-a-service,模型即服务)服务解决方案。
腾讯云并没有像此前的谷歌、微软,或者国内的百度、阿里等大厂一样,公布一个基础的通用大模型。腾讯云MaaS的技术底座是一系列的行业大模型,包括金融、政府、文旅、传媒、教育等。基于这些基础模型,腾讯云的客户只要加入自己的场景数据,就可以生成契合自身业务需要的「专属模型」。
除了提供基础的行业模型,数据方面,腾讯云同时推出了基于腾讯云 TI 平台的行业大模型精调解决方案。
除了计算集群,腾讯云还公布了更适合 AI 运算的「软能力」——向量数据库,它能更高效地处理图像、音频和文本等非结构化数据,支持单索引 10 亿级规模,比单机插件式检索规模提升 10 倍,数据接入 AI 的效率,也比传统方案提升 10 倍。
v1.30.21 版本是 DolphinDB 于2023年2月推出的稳定版,提供了异步复制、交易日历、自定义状态函数等多种新功能,从数据处理、安全管理、功能扩展到性能提升,做了全方位的优化。
同时,Defensor 联合星环科技数据 API 安全网关 Midgard、数据库监测与审计软件Audit 等数据安全产品可帮助企业构建事前可知可防、事中可控、事后可查的全链路数据安全防护体系。事前阶段,Defensor 可以帮助企业梳理敏感资产,形成敏感资产清单,同时明确敏感资产分布情况,并对敏感资产后续的访问进行权限和策略的配置。
事中阶段,星环科技依靠分布式高性能计算的数据积累,提供了高性能分布式脱敏产品方案。Defensor 脱敏引擎是分布式框架,支持节点横向扩展。
在显式的信息泄漏中,ChatGPT 等生成式大模型的训练数据在不经意间被转换成了生成内容,其中就包括了敏感和隐私的个人信息如银行卡账号、病例信息等。此外,ChatGPT 的数据安全和隐私隐患还体现在它对于对话框内容的存储,当用户在和 ChatGPT 互动时,他们的信息会以某些形式被记录和存储下来。
白皮书还提出了之前被大家忽略的隐式信息泄漏问题。ChatGPT体现出的数据安全和隐私的隐患是它可能通过对对话框数据的收集进行广告推荐,以及收集对话框数据进行推荐或者其他的下游机器学习任务,且ChatGPT 有时候可能也会生成虚假的信息,以此来诱导用户泄漏一系列的数据。
,自去年年底首次发布以来,ChatGPT在全球范围内引起轰动,它在消费者和IT专业人士中的受欢迎程度激起了关于如何使用它来利用系统漏洞的网络安全噩梦。网络安全专家已经证明,一个关键问题是ChatGPT和其他大型语言模型(LLM)生成多态或变异代码以逃避端点检测和响应(EDR)系统的能力。最近的一系列概念验证攻击展示了如何制作看似良性的可执行文件,以便在每个运行时,它都会对 ChatGPT 进行 API 调用。不仅可以重现已编写的代码片段的示例,还可以提示 ChatGPT 在每次调用时生成恶意代码的动态、变异版本,从而使网络安全工具难以检测到由此产生的漏洞利用。
6月14日,咨询机构麦肯锡发布了的一份题为《生成式人工智能的经济潜力》的研究报告,在报告中,分析师们通过对47个国家及地区的850种职业(全球80%以上劳动人口)的研究,探讨了在AI成指数级发展背后,对全球经济将带来的影响,哪些行业冲击最大,哪些人面临失业威胁?
·AI取代人类工作的时间被大幅提前了10年,在2030年至2060年间(中点为2045 年)50%的职业逐步被AI取代。
·AI每年可为全球经济带来2.6万亿至4.4万亿美元的增长,生产力提高0.1%—0.6%,相当于每年贡献一个英国的GDP。
·全局上看AI对各行各业的发展有利,但是对个人不利,而高薪、高学历的脑力劳动者受到的冲击最大。
·生成式AI带来的价值增长,主要(约75%)集中在四个领域:客户运营、营销和销售、软件工程和研发,这也意味着四项业务受生成式AI影响最大。
·生成式人AI及其他科技的发展或将使当前工作的60%到70%实现自动化。其中,银行业、高科技行业和生命科学等行业所受的影响最大。
根据欧洲议会的公告,《人工智能法案》通过。欧盟《人工智能法案》是全世界第一部通过议会程序、专门针对人工智能 (特别是 AIGC) 的综合性立法。按照立法议程,接下来将正式进入与欧洲理事会和欧盟委员会进行协商的程序,以确定最终版本的法案。
而在该法案中,生成式AI被划定为高风险,因为它们会对用户或第三方的安全、基本权利等产生负面影响。根据法规的草案规定,高风险的AI在投入使用之前需要承担严格的义务。这些义务包括:
除此之外,欧盟人工智能法案还要求生成式AI的开发人员,在AI投入使用后发布用于训练系统的受版权保护材料的摘要,包括数据库中有版权的书籍、文章、歌词或代码等。
针对目前各行业用户在落地广泛业务需求分析、处理多重数据模态对接、跟进高度定制场景问题解决、运营多源多框架AI模型等方面的问题,星环科技推出了自主研发的一站式智能分析工具平台Sophon 3.2,通过以数据和模型为中心,提供“六易三仓两中心”的功能服务,让用户能够基于自身需求构建紧密贴合其业务场景的新一代AI应用。
Sophon 3.2从数据接入获取、模型构建训练、模型运维管理、模型发布迭代等AI应用全生命周期的相关流程出发,考虑用户可能遇到的问题后,从样本管理、场景开发、模型获得、模型管理、效果迭代及系统运维六大方面降低用户使用的门槛,实现新一代AI平民化。
Sophon 3.2基于“三仓一平台”的框架,围绕数据开发全流程,以数据流视角分别建设“样本仓、模型仓和场景仓”,实现全流程、多模态数据的统一纳管。样本仓库:新版本Sophon提供的样本仓功能模块,可实现对数据的精细化管理,输出高质量多模数据,驱动高质量模型的迭代。
Sophon 3.2秉持以数据为中心和以模型为中心的理念,帮助用户将零散的数据和模型进行有效管理,并通过数据资产管理及模型资产管理等手段,实现数据和模型资产的价值迸发。
美国金融科技公司Broadridge子公司LTX近期宣布,推出一款基于GPT-4大模型的聊天机器人APP BondGPT,应用于公司债投资。
BondGPT主要面向公司债投资者,包括避险基金、交易商等,可以回答各种与债券相关的问题,并帮助用户解决相关问题。该产品号称将增强10.3万亿美元的美国公司债券市场的流动和价格发现。
Broadridge介绍称,子公司LTX将旗下债券分析平台Liquidity Cloud中的实时债券数据,输入到GPT-4大语言模型中,不仅简化了用户工作流程,还能避免AI胡说八道,提高用户在债券选择和构建投资组合方面的效率。
据悉,全新大模型相比第一代着力提升了决策与判断能力,实现了从感知、认知到决策的跨越,未来将在医疗、交通、工业生产等领域发挥更大作用。
本轮融资后续将主要用于核心研发团队的建设,加速多模态大模型和应用产品的研发。生数科技成立于2023年3月,由瑞莱智慧RealAI、蚂蚁和BV百度风投联合孵化成立,致力于成为全球领先的生成式人工智能基础设施及应用建设者。前瑞莱智慧副总裁唐家渝出任首席执行官。目前,生数科技正积极打造世界领先的可控多模态通用大模型,致力于通过生成式AI技术提升全人类的创造力与生产力。
通过此次收购,Virtana继续实现其愿景,即通过扩展其混合覆盖范围以支持云原生、开源、容器和无服务器功能,支持本地、云和边缘多供应商环境的简化和统一的混合基础架构可观测性。