一区二区三区在线观看,久久国产精品电影,国产精品欧美一区喷水,自拍偷拍欧美日韩

登錄注冊
新聞 資訊 金融 知識 財經(jīng) 理財 科技 金融 聯(lián)想專(zhuān)題 經(jīng)濟 產(chǎn)品 系統 連接 科技 聚焦 欄目首頁(yè) 游戲

九章云極DataCanvas公司DingoDB完成中國信通院權威多模數據庫測試

2024-05-17 17:11:03來(lái)源:今日熱點(diǎn)網(wǎng)

1.jpg

2024年5月16日,九章云極DataCanvas公司自主研發(fā)和設計的開(kāi)源多模向量數據庫DingoDB順利完成中國信息通信研究院(以下簡(jiǎn)稱(chēng)中國信通院)多模數據庫產(chǎn)品測試。本次測試的成功標志著(zhù)DingoDB在技術(shù)能力、性能表現和產(chǎn)品穩定性方面得到了權威機構的高度認可,并進(jìn)一步印證其為用戶(hù)提供可靠高效數據管理解決方案的能力,以及在多模數據庫領(lǐng)域的領(lǐng)先地位和卓越品質(zhì)。目前,DingoDB已完成中國信通院《向量數據庫標準》和《多模數據庫技術(shù)要求》兩大數據庫領(lǐng)域的重量級測試。

1715935435165275.jpg

DingoDB多模向量數據庫的多重能力

中國信通院作為國家級科研機構,承擔了多項國家級重大科研任務(wù)和標準制定工作,具有極高的權威性和公信力,其測試和認證在業(yè)內廣受認可。中國信通院定期對數據庫產(chǎn)品進(jìn)行全面測試,為用戶(hù)選擇合適的數據庫產(chǎn)品提供權威指南,本次多模數據庫產(chǎn)品測試正是基于《多模數據庫技術(shù)要求》的標準。該標準由中國信通院云計算與大數據研究所聯(lián)合多家企業(yè)專(zhuān)家制定,涵蓋了多模數據庫的基本能力、管理能力、兼容能力、安全能力、擴展能力、高可用等六大能力域,共33個(gè)測試項(包括21個(gè)必選項和12個(gè)可選項),測試產(chǎn)品需要滿(mǎn)足所有必選項方可通過(guò)。

DingoDB——功能完全內建的數據庫,而非多組件的簡(jiǎn)單堆砌

DingoDB集成了關(guān)系型、文檔、向量和鍵值四種數據模型,能為用戶(hù)提供高效多模型數據庫解決方案。區別于市場(chǎng)上很多多模數據庫廠(chǎng)商,它不是多個(gè)數據模型組件的簡(jiǎn)單堆砌,而是一款具備在線(xiàn)強一致性的完全內建的數據庫。

DingoDB產(chǎn)品特性:

· 企業(yè)級存儲可靠性:基于Multi-Raft多副本存儲,確保數據強一致性,滿(mǎn)足企業(yè)級容災需求。

· 多模數據聯(lián)合檢索:支持通過(guò)SQL進(jìn)行執行關(guān)系、向量、文檔的聯(lián)合檢索,并提供豐富的索引類(lèi)型,簡(jiǎn)化RAG應用的開(kāi)發(fā)復雜度,滿(mǎn)足各種場(chǎng)景需求。

· 多模數據庫的能力:部署一套DingoDB即可擁有鍵值緩存加速、關(guān)系數據庫和向量數據庫和文檔的服務(wù)能力,減少多個(gè)數據庫系統的維護和管理成本,提高整體系統的效率和靈活性。

· 兼容MySQL協(xié)議:用戶(hù)可以直接使用原生的MySQL客戶(hù)端訪(fǎng)問(wèn),無(wú)需學(xué)習新的數據庫語(yǔ)法和工具,降低用戶(hù)的使用門(mén)檻。

· 水平擴縮容:基于存算分離的架構設計,DingoDB能夠實(shí)現對性能和資源的一鍵水平擴容和縮容,使得企業(yè)能夠根據業(yè)務(wù)需求快速調整數據庫規模,有效應對流量變化。

· 多存儲引擎兼容:支持多種存儲引擎,使得企業(yè)可以根據業(yè)務(wù)特點(diǎn)選擇最適合的存儲引擎,最大化性能效益。

· 分布式事務(wù):支持多種數據模態(tài)下的分布式事務(wù),同時(shí)提供多種隔離級別,既兼容樂(lè )觀(guān)事務(wù)和悲觀(guān)事務(wù),確保事務(wù)在分布式環(huán)境下的完整性和一致性。

· 多租戶(hù)支持:原生支持多租戶(hù),服務(wù)隔離防止數據泄露與干擾。支持請求級動(dòng)態(tài)流控,靈活分配資源。支持混合存儲與按租戶(hù)和資源組隔離,確保資源的合理分配和高效利用。

· 開(kāi)源開(kāi)放:完整開(kāi)放數據庫源代碼,提供豐富的多語(yǔ)言SDK及詳盡的開(kāi)發(fā)文檔,滿(mǎn)足用戶(hù)在不同應用開(kāi)發(fā)場(chǎng)景中的需求。

DingoDB場(chǎng)景應用:

1)基于RAG技術(shù)的場(chǎng)景的應用

DingoDB覆蓋關(guān)系型、文檔、向量和鍵值等多種數據模型的特點(diǎn),使得它在基于RAG技術(shù)(Retrieval Augmented Generation)的場(chǎng)景中得到廣泛應用,例如企業(yè)知識管理場(chǎng)景。該場(chǎng)景的目標是從海量的技術(shù)文檔中找到與問(wèn)題相關(guān)的片段并生成回答。這個(gè)過(guò)程需要結合大語(yǔ)言模型(LLM,large language model)和多模數據庫的能力。其中,LLM因為無(wú)法直接生成與技術(shù)內容相關(guān)的答案,只起到輔助性作用,效果好壞是由執行檢索任務(wù)的多模數據庫決定。在該場(chǎng)景,DingoDB提供兩種不同的檢索方式來(lái)召回相關(guān)文本數據,包括向量檢索和關(guān)鍵詞檢索。向量檢索依賴(lài)于DingoDB的向量數據庫功能,而關(guān)鍵詞檢索則依賴(lài)于其文檔數據庫功能。這種多模檢索方式能有效提高生成內容的準確性、連貫性和信息量,確保用戶(hù)獲得更高質(zhì)量的響應。

使用DingoDB的企業(yè)知識管理場(chǎng)景的流程如下,分為下列三個(gè)步驟:

1715935466630970.png

基于DingoDB多模向量數據庫的RAG構建流程

· Step1.文檔解析入庫

將企業(yè)的技術(shù)文檔上傳,通過(guò)Text Splitter模塊進(jìn)行分割,生成多個(gè)文本塊(段落、句子等)。對文本塊進(jìn)行標注提取,生成標題或標簽,便于檢索。對于包含表格的數據,生成描述性句子,確保表格內容能被準確理解和檢索。最后,通過(guò)Embedding模型將文本塊向量化,生成用于向量檢索的表示,存入DingoDB。

· Step2. 基于DingoDB的向量檢索和關(guān)鍵詞檢索

用戶(hù)提出問(wèn)題后,通過(guò)Embedding模型生成向量表示,在DingoDB中進(jìn)行向量檢索,找到最相關(guān)的多個(gè)文本塊。關(guān)鍵詞檢索是為解決用戶(hù)口頭表達與專(zhuān)業(yè)文檔不匹配而造成的檢索不準確問(wèn)題。關(guān)鍵詞檢索通過(guò)LLM提取關(guān)鍵詞,輸入DingoDB進(jìn)行關(guān)鍵詞匹配(match召回),找到相關(guān)文本塊。DingoDB支持標量向量聯(lián)合檢索,結合關(guān)鍵詞匹配和向量召回進(jìn)行混合召回,返回TopN相關(guān)文本塊。

· Step3. 答案生成

將檢索到的TopN相關(guān)文本塊通過(guò)預定義的Prompt模板傳遞給LLM,由LLM生成詳細且準確的答案。

綜上所述,在大語(yǔ)言模型時(shí)代的RAG典型應用企業(yè)知識管理場(chǎng)景,DingoDB可以高效地處理和檢索海量技術(shù)文檔,提供精準、及時(shí)的答案,支持企業(yè)內部的信息查詢(xún)和知識管理。依托該場(chǎng)景,DingoDB在多家央企客戶(hù)得到應用。

2)分布式KV場(chǎng)景的應用

在金融行業(yè)的實(shí)時(shí)風(fēng)控、反欺詐、精準營(yíng)銷(xiāo)、產(chǎn)品推薦等需要亞秒級決策的場(chǎng)景,DingoDB以其高性能和低延遲的特點(diǎn),輕松駕馭亞秒級大規模數據處理與分析,為實(shí)時(shí)決策提供堅實(shí)的服務(wù)支撐。DingoDB采用先進(jìn)的數據復制與故障轉移機制,并通過(guò)持久化技術(shù)確保數據安全可靠。同時(shí),能根據業(yè)務(wù)需求靈活擴展計算與存儲資源,從容應對數據處理需求的持續增長(cháng)。DingoDB具備滿(mǎn)足信創(chuàng )標準的高頻Serving計算能力,使企業(yè)在面對實(shí)時(shí)數據處理和決策時(shí)能夠快速響應。

3)其他場(chǎng)景的應用

除上述兩類(lèi)場(chǎng)景,DingoDB還在多種豐富場(chǎng)景應用中展現了其強大的功能和多樣化的能力。

1715935485959667.png

DingoDB多模向量數據庫支撐多種業(yè)務(wù)場(chǎng)景

● Vector Ocean數據支撐:Vector Ocean是九章云極DataCanvas對數據架構的一種全新設想。DingoDB在Vector Ocean中提供結構化和非結構化數據的存儲,支持多模態(tài)數據分析能力和科學(xué)計算能力。其強大的數據處理能力使得企業(yè)能夠在一個(gè)平臺上處理多種數據類(lèi)型,簡(jiǎn)化數據管理流程。

● 大模型記憶體:DingoDB輔助大語(yǔ)言模型生成前的Prompt管理,提供高效并發(fā)的搜索答案能力。這在大語(yǔ)言模型時(shí)代尤為重要,能夠為AI模型提供可靠的數據支持,提升模型生成答案的準確性和效率。

● 結構化與非結構化數據的融合分析:DingoDB支持音頻、視頻、文本等非結構化數據的向量化存儲,提供結構化與向量數據的聯(lián)合分析和計算能力。這種融合分析能力使得企業(yè)能夠從多維度進(jìn)行數據分析,獲取更全面的洞察。

總結

綜上所述,DingoDB作為一款多模數據庫,在企業(yè)知識管理、實(shí)時(shí)決策、數據支撐、大語(yǔ)言模型應用以及多類(lèi)型數據檢索和分析等方面展現出強大的應用能力,獲得了廣泛的認可和好評。DingoDB不僅可以充當海量數據的存儲中心,還是推動(dòng)數據驅動(dòng)決策的核心動(dòng)力。在數字化轉型的浪潮中,DingoDB成為傳統業(yè)務(wù)與前沿技術(shù)的重要橋梁。無(wú)論是云計算的高效處理、大數據的深度分析、人工智能的智能決策,還是物聯(lián)網(wǎng)的實(shí)時(shí)數據交換,DingoDB都能提供堅實(shí)的數據分析和處理支撐。

免責聲明:市場(chǎng)有風(fēng)險,選擇需謹慎!此文僅供參考,不作買(mǎi)賣(mài)依據。

關(guān)鍵詞:

推薦內容

熱點(diǎn)
39熱文一周熱點(diǎn)