常用大數據術語一覽表

2016/9/1 0:00:00       來源:        作者:來源:51CTO,作者:布加迪編譯       瀏覽量:  1


常用大數據術語一覽表


大數據有許多新術語,有時不好理解。因此,我們列出了一份大數據術語表,以便大家深入了解。當然,這份大數據術語表并不是百分之分全面,要是你認為遺漏了什么術語,請告知我們。
A
聚合-搜索、收集和顯示數據的過程。
算法-可以對數據執行某種分析的數學公式。
分析―發現數據蘊含的洞察力。
異常檢測-搜索數據集中與預測模式或預期行為不匹配的數據項。異常又叫outlier、exception、surprise或 contaminant,它們常常提供了關鍵的、可付諸行動的信息。
匿名化-使數據匿名,即移除可能表明個人身份的所有數據點。
應用程序-讓計算機能夠執行某項任務的計算機軟件。
人工智能-研發智能機器和軟件,它們能夠感知周圍環境,并且在需要時采取相應的動作,甚至從那些動作中學習。
B
行為分析-這種分析可以表明如何、為何和什么,而不是僅僅表明是誰和何時。它可分析數據中的人性化模式。
大數據科學家-能夠開發解讀大數據的算法的人。
大數據初創公司―開發新穎大數據技術的新興公司。
生物特征識別-根據人的生物特征來識別人的身份。
波字節(BB)-約等于1000堯字節,相當于未來數字化宇宙的大小。1波字節有27個0!
商業智能-讓數據易于理解的一套理論、方法和過程。
C
分類分析-從數據獲取重要相關信息的系統化過程,又叫元數據,即描述數據的數據。
云計算-網絡上用于異地存儲數據的分布式計算系統。
聚類分析-識別彼此相似的對象并聚集成類的過程,以便了解數據里面的相似之處和不同之處。
冷數據存儲-將很少使用的舊數據存儲在低功耗服務器上。檢索數據耗時較長。
對比分析-它確保采用逐步的比較和計算過程,以便發現非常大的數據集里面的模式。
復雜的結構化數據-由兩個或多個復雜的關聯部分組成的數據,它們不容易被結構化查詢語言和工具來解析。
計算機生成的數據-計算機生成的數據,比如日志文件。
并發-同時運行或執行多個任務或進程。
關聯分析-分析數據,以便確定變量之間的關系,確定這種關系是負關系(-1.00)還是正關系(+1.00)。
客戶關系管理(CRM)-管理銷售和業務流程,大數據會影響CRM策略。
D
儀表板-使用圖形化顯示算法執行的分析的工具。
數據聚合工具-將分散于眾多數據源的數據轉化成單一新數據源的過程。
數據分析員-分析、建模、清理或處理數據的人員。
數據庫-數據通過某種技術存儲起來的數字化集合。
數據庫即服務-托管在云端的數據庫,按使用量付費,比如亞馬遜網絡服務(AWS)。
數據庫管理系統(DBMS)-收集和存儲數據,并提供數據訪問。
數據中心-放置用來存儲數據的服務器的實際場地。
數據清洗-審查和修訂數據的過程,以便刪除重復數據、糾正錯誤,并提供一致性。
數據管理員-負責數據存儲所需技術環境的人員。
數據道德準則-幫助企業組織在數據方面做到透明的準則,確保簡潔性、安全性和隱私性。
數據源-一種數據流,比如推特數據源或RSS。
數據市場-進行數據集買賣的在線環境。
數據挖掘-從數據集中找到某些模式或信息的過程。
數據建模-使用數據建模技術來分析數據對象,從數據獲得洞察力。
數據集-數據集合。
數據虛擬化-數據整合過程,以便獲得更多的洞察力。它通常涉及數據庫、應用程序、文件系統、網站和大數據技術等等。
去身份識別-跟匿名化一樣;確保無法通過數據來識別人員身份。
判別分析-對數據分類;將數據分成不同的群組或類別。數據中的某些群組或聚類事先已知的情況下使用統計分析,利用該信息生成分類規則。
分布式文件系統-提供一種簡化的、高可用的方法來存儲、分析和處理數據的系統。
文件存儲數據庫-一種為了存儲、管理和檢索文檔而專門設計的一種面向文檔的數據庫,又叫半結構化數據。
E
探索性分析-不用標準的程序或方法,找到數據里面的模式。這是發現數據、找到數據集主要特點的一種方法。
艾字節(EB)-約等于1000拍字節或10億吉字節。如今全球每天生成的新信息量約為1艾字節。
提取、轉換和加載(ETL)-這是數據庫和數據倉庫的一種方法,從各個數據源提取數據,轉換數據,以適合業務運營要求,最后加載到數據庫。
F
故障切換-萬一某個服務器或節點發生故障,自動切換到另一個不同的服務器或節點。
容錯設計-即便某些部件發生故障,也能繼續正常運行的特別設計的系統。
G
游戲化-在非游戲環境下使用游戲元素;它對于生成數據非常有用,因而被稱為是友好地搜索大數據。
圖形數據庫-使用圖形結構(比如一組有限的有序對或某些實體),使用邊緣、屬性和節點用于數據存儲。它提供了無索引的相鄰性,這意味著每個元素與相鄰元素直接聯系起來。
網格計算-常常通過云,將諸多地方的不同計算機系統連接起來,以實現某個共同的目標。
H
Hadoop-為了能夠跨分布式文件系統處理和存儲大數據而構建的一種開源框架。
HBase-這是與Hadoop一起運行的開源非關系型分布式數據庫。
HDFS-H

主站蜘蛛池模板: 少妇人妻综合久久中文字幕| 色综合小说天天综合网| 色综合久久综合网| 一本一道久久综合狠狠老| 亚洲AV综合色区无码二区偷拍| 久久九色综合九色99伊人| 久久久久综合中文字幕| 天天做.天天爱.天天综合网| 国产精品无码久久综合网| 狠狠色丁香久久综合五月| 国产婷婷色综合AV蜜臀AV| 五月天婷五月天综合网站| 亚洲国产综合精品中文第一区| 狠狠色丁香婷婷综合精品视频| 国产精品无码久久综合网| 亚洲国产综合精品中文第一区| 亚洲av日韩综合一区久热| 久久国产精品亚洲综合| 伊人久久大香线焦AV综合影院| 日韩人妻无码一区二区三区综合部| 久久综合精品国产二区无码| 亚洲色欲色欲综合网站| 91精品国产综合久久久久| 久久93精品国产91久久综合| 亚洲综合在线观看视频| 色综合婷婷在线观看66| 国产亚洲欧洲Aⅴ综合一区| 狠狠人妻久久久久久综合蜜桃| 狠狠色丁香婷婷综合久久片| 亚洲伊人色一综合网| 狠狠色噜噜狠狠狠狠色吗综合| 国产尹人香蕉综合在线电影| 国产AV综合影院| 婷婷激情综合色五月久久| 亚洲国产成人精品无码久久久久久综合| 久久亚洲欧洲国产综合| 亚洲综合色婷婷七月丁香| 亚洲人成依人成综合网| 亚洲国产天堂久久综合网站| 开心五月激情综合婷婷| 激情综合色五月丁香六月亚洲|