引言
伴隨著信息高速公路的興起,多媒體正在深入我們的生活,物聯網時代也離我們越來越近。在對文字、圖形、圖像、視頻及聲音等多種媒體信息進行綜合處理時,傳統的信息檢索已經不能滿足人們的需求,信息的查找和檢索要求也越來越高。
1面向物聯網的多媒體數據庫特點
多媒體數據庫是多媒體技術與數據庫技術相結合而產生的一種新型數據庫,是指數據庫中的信息不僅涉及各種數字、字符等格式化的表達形式,而且還包括多媒體的非格式化的表達形媒體數據的存儲、讀取、檢索等功能的數據庫系統。多媒體數據庫繼承了傳統數據庫的一些優(yōu)點,但數據管理要涉及到更復雜的處理。與此同時,繼計算機、互聯網之后,物聯網帶來了信息技術的第三次革命,經過綜合分析,物聯網環(huán)境下的多媒體數據與傳統的數據相比,往往具有一些獨立的特性。
1.1數據的非結構化
聲音、圖像、影視等數據基本上都是二進制串。這些數據從其本身看不出任何結構,因此稱為非結構化數據。各種媒體的數字化存儲形式稱為多媒體數據。因為這些數據往往通過傳感器輸入計算機,又稱傳感器數據。媒體數據如果不另加一些描述和解釋,一般很難利用對數據的描述和解釋。這些特征使得傳統的關系型DBMS難以有效地管理這些類型的數據,從而促使我們去研究、引入新型的DBMS系統。
1.2實時,性和快速更新
物聯網技術是基于各種感知技術的應用。其上部署了多種類型傳感器,不同類型的傳感器捕獲的數據內容和數據格式各不相同。由于每個傳感器都是一個信息源,采集信息在一定頻率的周期性環(huán)境下,傳感器獲得的多媒體數據也不斷更新,具有實時性。
1.3數據量大且維度高
物聯網是一種建立在互聯網上的泛在網絡。物聯網技術的重要核心仍在互聯網,通過各種有線和無線網絡與互聯網融合,將物體的信息實時準確地傳遞出去叫多媒體數據量一般都很龐大。雖然采取了數據壓縮技術,但壓縮后的數據量還是很大。在物聯網上的傳感器定時采集的信息需要通過網絡傳輸,所以,這樣的海量數據對多媒體數據庫的存儲及檢索提出了更高的要求,同時還要考慮海量數據傳輸標準的統一。
2面向物聯網的多媒體數據庫檢索
多媒體數據包括文字、圖像、視頻、音頻等不同格式的信息內容。隨著互聯網的發(fā)展,傳統的基于結構化的關系數據庫檢索方式并不適合非結構化的多媒體數據的檢索,人們對多媒體數據的檢索提出了新的要求?;趦热莸臋z索就是從媒體數據中提取出特定的信息線索,然后根據這些線索從大量存儲在數據庫中的媒體中進行查找,檢索出具有相似特征的媒體數據來。它可以在更深層次更有效地利用存儲的多媒體信息。
基于內容的檢索是一個逐步求精的過程[3]:第一是從媒體內容中提取信息線索。基于內容的檢索直接對圖像、視頻、音頻內容進行分析,抽取特征和語義,利用這些內容特征進行索引,并進行檢索。第二是相似性匹配,就是將查詢特征與特征庫中的資料按照一定的匹配算法進行形似匹配,把滿足一定相似性的一組候選結果按相似度大小排列放回給用戶。第三是特征調整。對于系統返回的查詢結果,用戶可選擇滿意結果,或從中選擇一個示例,經特征調整形成新的查詢。第四,逐步縮小檢索范圍,直到用戶滿意。其具體過程如圖1所示。
2.1基于內容的圖像檢索技術
基于內容的圖像檢索技術是指利用一定的算法提取圖庫中圖像的顏色、紋理、形狀等特征進行檢索。用戶提供一個樣例圖像,系統提取樣例圖像的特征,然后跟數據庫中的所有圖像的特征進行比較,并將與樣例特征相似的圖像返回給用戶。
2.2基于內容的視頻檢索技術
視頻主要由鏡頭組成,鏡頭由一系列連續(xù)的幀組成,幀是一幅靜態(tài)的圖像,是組成視頻的最小單位?;趦热莸囊曨l檢索的關鍵步驟是視頻的分割,分割完成后,也就確定了每個鏡頭的開始和結束位置。每個鏡頭中的一系列幀的差異很小,可以從中選擇出關鍵幀來描述鏡頭的關鍵圖像,對該鏡頭的檢索可以轉換為對該關鍵幀的檢索。由于視頻中的關鍵幀就是一副靜態(tài)的圖像,因此,可以使用類似圖像檢索的方法進行檢索。
2.3基于內容的音頻檢索技術
基于內容的音頻檢索可以提取音頻數據中的特征信息,對不同音頻進行特征匹配,從而達到檢索的目的。一般以韻律、和音、旋律以及音調、響度、音色等感知特征進行特征值檢索,根據查詢索引和數據庫中音頻索引之間的相似性,來對音頻片段進行檢索。除實際發(fā)聲詞匯外,包含在語音中的其他信息,如發(fā)音者的身份和情緒都有助于語音索弓I和檢索。
3面向物聯網的多媒體數據檢索策略
針對多媒體數據的特點,分析物聯網環(huán)境中信息檢索遇到的問題,一方面可以考慮提高服務器的處理能力、擴充服務器的存儲容量,另一方面,則可以考慮優(yōu)化查詢策略以提高檢索速度。優(yōu)化策略可以從三個方面來考慮。
3.1臨時表緩沖策略
對數據表操作時,傳統的方法是直接對表進行關系運算,然后從中選擇滿足要求的結果集。而采用臨時表的做法,則虐先對大數據表進行查詢,將滿足條件的數據預先讀取到臨時表中,然后將對源數據表的訪問轉換為對臨時表的訪問。將操作的數據集預先讀取到臨時表中會給系統帶來額外的開銷。但是,在一般情況下,臨時表中的數據集要遠小于源數據表中的數據集,因此,在對于海量數據進行連續(xù)操作或者頻繁訪問時,采用此策略可提高系統的總體性能。
3.2數據的降維處理策略
人們在物聯網世界獲得的數據量正以指數形式快速增長,為了減輕系統檢索的負荷,可以對數據進行降維處理。結合具體業(yè)務需求,在盡可能多的保留初始數據的前提下,將數據的維數降到一個合理的大小,再將降維處理后的數據送入信息處理系統,這對海量數據的檢索是行之有效的。降維算法主要分為線性降維算法和非線性降維算法。降維的實質就是尋找投影變換,即從高維空間到低維空間的變換。同時,降維處理也是一些智能算法的必要步驟,該策略對物聯網數據檢索中的智能處理是很有幫助的。
3.3情景感知的語義檢索策略
物聯網是通過射頻識別、紅外感應器、全球定位系統、激光掃描器等信息傳感設備,把任何物品與互聯網連接起來,進行數據交換?;诟袘W絡,可以從大規(guī)模的海量數據中獲取用戶的位置數據、鄰接數據、通信數據和行為數據等,并對如此海量的移動數據進行實時挖掘,推導出蘊含在數據中的規(guī)律,感知用戶的情景環(huán)境,發(fā)現用戶的行為模式,將最能滿足用戶需求的結果提交給用戶,以實現用戶所得即所需,從而有效提高物聯網信息檢索的質量。
4結語
隨著物聯網技術的應用發(fā)展,人們對此環(huán)境下多媒體數據庫的檢索需求也越來越迫切?!皵祿碾y”成為急需解決的問題。利用云計算、模式識別等各種智能技術,可以從傳感器獲得的海量信息中檢索、加工處理出有意義的數據。隨著理論研究和時間探索的不斷深入,面向物聯網的檢索技術一定會更加完善,充滿智能的物聯網多媒體數據庫的應用也將逐步推向各個行業(yè)和領域。
20211018_616c5a5d90edf__面向物聯網的多媒體數據庫檢索技術應用研究





