<rt id="eeo40"><acronym id="eeo40"></acronym></rt>
  • <dd id="eeo40"><s id="eeo40"></s></dd>
  • <menu id="eeo40"><code id="eeo40"></code></menu>
  • 您的位置:首 頁(yè) > 新聞中心 > 企業(yè)網(wǎng)站設(shè)計(jì) > 企業(yè)網(wǎng)站設(shè)計(jì)基于機(jī)器學(xué)習(xí)的通用識(shí)別方式

    企業(yè)網(wǎng)站設(shè)計(jì)

    企業(yè)網(wǎng)站設(shè)計(jì)基于機(jī)器學(xué)習(xí)的通用識(shí)別方式

    發(fā)布:2020-12-22 13:04:57 瀏覽:2268

            基于機(jī)器學(xué)習(xí)的通用識(shí)別方式。近年來(lái)隨著機(jī)器學(xué)習(xí)算法的興起,很多文獻(xiàn)提出將相關(guān)算法用到垃圾頁(yè)面識(shí)別并已經(jīng)取得了很好的效果。

            由于從本質(zhì)上來(lái)說(shuō)垃圾頁(yè)面識(shí)別是一個(gè)二值分類問(wèn)題,而機(jī)器學(xué)習(xí)中有很多相應(yīng)的算法可以被利用。這些算法的共同點(diǎn)通常都是先將網(wǎng)頁(yè)數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集,然后對(duì)網(wǎng)頁(yè)數(shù)據(jù)進(jìn)行預(yù)處理,去除數(shù)據(jù)中的無(wú)用信息包括HTML標(biāo)簽、Java Script腳本代碼、大量存在的圖片等等,然后對(duì)網(wǎng)頁(yè)內(nèi)容特征(網(wǎng)頁(yè)字?jǐn)?shù)、標(biāo)題字?jǐn)?shù)、熱門關(guān)鍵詞、網(wǎng)頁(yè)壓縮率等)和鏈接結(jié)構(gòu)特征(入鏈數(shù)、出鏈數(shù)、入鏈出鏈比例、Page Rank值等)進(jìn)行提取作為訓(xùn)練集的輸入得出輸入輸出的映射關(guān)系,最后將這種映射關(guān)系用測(cè)試集進(jìn)行驗(yàn)證。


    >>> 查看《企業(yè)網(wǎng)站設(shè)計(jì)基于機(jī)器學(xué)習(xí)的通用識(shí)別方式》更多相關(guān)資訊 <<<

    本文地址:http://www.modelkey.org/news/html/22560.html

    趕快點(diǎn)擊我,讓我來(lái)幫您!
    亚洲高清无码中文成人在线,AV色综合久久天堂AV色综合在,久久人人爽人人爽人人片av高,日本亚洲成a人片在线观看
    <rt id="eeo40"><acronym id="eeo40"></acronym></rt>
  • <dd id="eeo40"><s id="eeo40"></s></dd>
  • <menu id="eeo40"><code id="eeo40"></code></menu>