精品一区二区三区在线成人,欧美精产国品一二三区,Ji大巴进入女人66h,亚洲春色在线视频

在 Python 中使用機器學習來檢測釣魚鏈接

安全 網站安全
本文將會給出一個簡短的教程,旨在介紹如何檢測這種網絡釣魚的企圖。注意,本文將使用 Jupyter Notebook。當然,你也可以使用 Google Colab 或 Amazon Sagemaker,如果你對這些更熟悉的話。

在網絡釣魚攻擊中,用戶會收到一封帶有誤導性鏈接的郵件或信息,攻擊者可以利用它來收集重要數據,比如你的銀行卡密碼。本文將會給出一個簡短的教程,旨在介紹如何檢測這種網絡釣魚的企圖。

通過網絡釣魚攻擊,攻擊者能夠獲得一些重要憑證,這些憑證可以用來進入你的銀行或其他金融賬戶。攻擊者發送的 URL 看起來與我們日常使用的原始應用程序完全相同。這也是人們經常相信它,并在其中輸入個人信息的原因。釣魚網址可以打開一個網頁,它看起來與你的銀行的原始登錄頁面相似。最近,這樣的網絡釣魚攻擊正變得相當普遍,所以,檢測釣魚鏈接變得非常重要。因此,我將介紹如何在 Python 中使用機器學習來檢查一個鏈接是誤導性的還是真實的,因為它可以幫助我們看到網頁代碼及其輸出。注意,本文將使用 Jupyter Notebook。當然,你也可以使用 Google Colab 或 Amazon Sagemaker,如果你對這些更熟悉的話。

下載數據集

第一步,我們需要用于訓練數據集。你可以從下面的鏈接中下載數據集。

真實的鏈接:https://github.com/jishnusaurav/Phishing-attack-PCAP-analysis-using-scapy/blob/master/Phishing-Website-Detection/datasets/legitimate-urls.csv

釣魚鏈接:https://github.com/jishnusaurav/Phishing-attack-PCAP-analysis-using-scapy/blob/master/Phishing-Website-Detection/datasets/phishing-urls.csv

訓練機器進行預測

當數據集下載完成,我們需要使用以下幾行代碼來導入所需的庫:

    import pandas as pd
from sklearn.ensemble import RandomForestClassifier

如果你沒有這些庫,你可以使用 pip 工具來安裝這些庫,如下圖所示:

使用 pip 工具安裝依賴庫

當依賴安裝完成,你就可以導入數據集,并將其轉換為 pandas 數據框架,使用以下幾行代碼進一步處理:

    legitimate_urls = pd.read_csv(/home/jishnusaurav/jupyter/Phishing-Website-Detection/datasets/legitimate-urls.csv”)
phishing_urls = pd.read_csv(/home/jishnusaurav/jupyter/Phishing-Website-Detection/datasets/phishing-urls.csv”)

在成功導入后,我們需要把這兩個數據集合并,以便形成一個數據集。合并后的數據集的前幾行如下圖所示:

合并后的數據集的前幾行

然后去掉那些我們不需要的列,如路徑(path)、協議(protocol)等,以達到預測的目的:

urls = urls.drop(urls.columns[[0,3,5]],axis=1)

在這之后,我們需要使用以下代碼將數據集分成測試和訓練兩部分:

data_train, data_test, labels_train, labels_test = 
train_test_split(urls_without_labels, labels, test_size=0.30,
random_state=110)

接著,我們使用 sklearn 的隨機森林分類器建立一個模型,然后使用 fit 函數來訓練這個模型。

    random_forest_classifier = RandomForestClassifier()
random_forest_classifier.fit(data_train,labels_train)

完成這些后,我們就可以使用 predict 函數來最終預測哪些鏈接是釣魚鏈接。下面這行可用于預測:

prediction_label = random_forest_classifier.predict(test_data)

就是這樣啦!你已經建立了一個機器學習模型,它可以預測一個鏈接是否是釣魚鏈接。試一下吧,我相信你會滿意的!

責任編輯:未麗燕 來源: Linux中國
相關推薦

2015-09-01 14:29:33

2015-09-01 10:32:11

2023-02-03 11:40:49

機器學習分析情感

2020-07-24 10:52:45

人工智能

2019-07-23 10:22:11

TensorFlow.Python機器學習

2011-09-06 16:30:32

iOS系統靜態鏈接庫

2022-04-01 15:39:13

機器學習讓孩子們軟件交付

2018-06-14 14:05:48

機器學習大數據卡通上色

2024-08-08 08:24:53

2021-07-29 10:00:43

XMLXMLStarletLinux

2017-04-14 08:33:47

2012-11-02 11:37:28

2010-03-17 11:15:44

Python學習筆記

2020-02-27 14:47:11

人工智能機器學習故障檢測

2021-04-13 09:00:00

機器學習鐵路技術

2025-07-29 07:51:41

2024-07-23 16:37:04

2022-06-05 21:16:08

機器學習Python

2022-06-09 09:14:31

機器學習PythonJava

2022-08-29 17:12:07

人工智能機器學習Android
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 彰化市| 乾安县| 托克逊县| 茶陵县| 周至县| 通城县| 溧阳市| 临西县| 桃江县| 疏附县| 泗阳县| 宜宾市| 磴口县| 阳江市| 韶关市| 武陟县| 辰溪县| 克东县| 湖南省| 巴林左旗| 灵武市| 鹿泉市| 泸水县| 大城县| 金川县| 昌图县| 家居| 新乡市| 新龙县| 河东区| 万载县| 龙州县| 旬邑县| 澎湖县| 抚松县| 庆云县| 武穴市| 京山县| 博罗县| 牙克石市| 陆川县|