數(shù)據(jù)挖掘就是從龐大的數(shù)據(jù)庫(kù)中抽取轉(zhuǎn)換分析一些潛在規(guī)律和價(jià)值,從中獲取決策的關(guān)鍵信息和有用知識(shí)。分析方法是數(shù)據(jù)挖掘的核心工作,通過(guò)科學(xué)可靠的算法才能實(shí)現(xiàn)數(shù)據(jù)的挖掘,找出數(shù)據(jù)中潛在的規(guī)律。
不同的分析方法將解決不同類(lèi)型的問(wèn)題,在現(xiàn)實(shí)中針對(duì)不同的分析目標(biāo),找出相對(duì)應(yīng)的方法常用的分析方法聚類(lèi)分析聚類(lèi)分析就是將物理或抽象對(duì)象的進(jìn)行分組,然后組成為由類(lèi)似或相似的對(duì)象組成的多個(gè)分類(lèi)的分析過(guò)程,。
這不同于分類(lèi),因?yàn)樗鼰o(wú)法獲知對(duì)象的屬性。物以類(lèi)聚,人以群分,通過(guò)聚類(lèi)來(lái)分析事物之間類(lèi)聚的潛在規(guī)律。聚類(lèi)分析廣泛運(yùn)用于心理學(xué)統(tǒng)計(jì)學(xué),注漿管生物學(xué)市場(chǎng)銷(xiāo)售數(shù)據(jù)識(shí)別機(jī)器智能學(xué)等領(lǐng)域。聚類(lèi)分析根據(jù)隸屬度的取值范圍可分為硬聚類(lèi)和模糊聚類(lèi)兩種方法。
硬聚類(lèi)就是將對(duì)象劃分到距離聚類(lèi)的類(lèi),非此即彼,也就是說(shuō)屬于一類(lèi),就必然不屬于另一類(lèi)。模糊聚類(lèi)就是根據(jù)隸屬度的取值范圍的大小差異來(lái)劃分類(lèi),一個(gè)樣本可能屬于多個(gè)類(lèi)。常見(jiàn)的聚類(lèi)算法主要有密度聚類(lèi)算法層次格聚類(lèi)算法模型聚類(lèi)算法等分類(lèi)和分類(lèi)和數(shù)值是問(wèn)題的兩種主要類(lèi)型。
分類(lèi)是分類(lèi)離散無(wú)序的標(biāo) ,面則是建立連續(xù)值函數(shù)模型。分類(lèi)是數(shù)據(jù)挖掘的重要基礎(chǔ),它針對(duì)已知的訓(xùn)練數(shù)據(jù)集出來(lái)的特性,每個(gè)類(lèi)別的描述或?qū)傩詠?lái)構(gòu)造相應(yīng)的分類(lèi)器或者分類(lèi)。分類(lèi)是一種有的學(xué)過(guò)程,它是根據(jù)訓(xùn)練數(shù)據(jù)集發(fā)現(xiàn)準(zhǔn)確描述來(lái)劃分類(lèi)別的。