根據站點(diǎn)生成sitemap.xml的腳本
簡(jiǎn)介
本人遠程服務(wù)器上面除了搭建博客之外,還搭建了Gitea私人代碼倉庫和圖床服務(wù),但是兩個(gè)服務(wù)上面都沒(méi)有自帶 sitemap.xml
,不方便搜索引擎收錄對應的鏈接。于是乎自己寫(xiě)了個(gè)腳本用來(lái)自動(dòng)生成 sitemap.xml
使用
項目地址:https://git.zeekling.cn/python/sitemap
- 安裝依賴(lài)
pip3 install -r requirement.txt
- 修改相關(guān)參數,下面是我自己使用的一個(gè),供參考:
修改get_url.py
# 當前域名的http鏈接
url_root = 'https://git.zeekling.cn'
# 需要抓取的根鏈接,可以多寫(xiě)幾個(gè)
url_mine_list = [
'https://git.zeekling.cn/',
'https://git.zeekling.cn/zeekling'
]
# 抓取的最大棧深度,默認為2,如果網(wǎng)站比較大的話(huà)不建議設置太大,可以在url_mine_list多設置url
max_depth = 2
# 不需要寫(xiě)進(jìn)sitemap.xml的鏈接
url_robot_arr = [
'/user/sign_up',
'/user/login',
'/user/forgot_password'
]
修改sitemap.xml位置,sitemap.py
# 第一個(gè)參數為sitemap.xml的位置
create_xml('sitemap.xml', get_url.url_res_final)
- 執行腳本
./sitemap.py
執行完成之后就會(huì )生成 sitemap.xml
當然為了更新的快一點(diǎn)可以加入到定時(shí)任務(wù)里面:
0 */6 * * * cd /root/git-sitemap && ./sitemap.py
- 修改nginx配置,讓搜索引擎能夠訪(fǎng)問(wèn)得到即可。

0 評論