Python学习中要注意的实用知识点_惠州计算机Python培训学校
作者:黄君发布时间:2021-05-27分类:惠州计算机学校浏览:767
1、Python连接MySQL加编码
记得加charset,没加的话部署Linux服务器运行可能有中文乱码,已踩坑
2、最好用utf8mb4
很多时候我会用sqlalchemy创建连接数据库引擎,charset用的utf8mb4,原因在于爬取的文本中有表情,utf8不行,同时,数据库、表,编码也都要保持一致
3、好用的网页解析库PyQuery
from pyquery import PyQuery as py
觉得好用的原因:
1、语法类似JQuery,好记
2、可以增删改查html元素,然后下载网页,这点xpath就比较弱了,下面是我最近用到的一些方法,其他方法可以网上查查
#爬虫下载网页
each_res = requests.get(url).content.decode("utf-8")
#转为pyquery文档
doc = py(each_res)
#支持Class选择器,remove用来删除元素
doc(".site-navbar ul")("li").remove()
#支持ID选择器
doc("#search-form").remove()
#获取属性href的值
doc(".pagemenu")("li:first-child")("a").attr["href"]
#设置属性href的值
doc(".pagemenu")("li:first-child")("a").attr("href", "./")
#遍历对象
images_src = doc("img")
for img in images_src:
if py(img).attr["src"]:
print(py(img).attr["src"])
#添加元素
doc("head").append('<link rel="stylesheet" href="../common/css/common.css">\n')
#清空后在添加
doc(".page-right .item").empty().append("<a href='#' class='ad1'><img></img></a>")
#完美匹配jquery的eq()选择方法
doc(".article-content")("div:last-child").eq(-1).remove()
#大招来了,可以将上面增删改查的文档,直接写入html文件,就下载好网页了
res = doc.outer_html().encode("utf-8")
with open("index.html", "wb") as f:
#写文件用bytes而不是str,所以要转码
f.write(res)
4、Linux配置python3环境、pip软链接
下方分别为解压安装,配软连接,注意配python3和pip的时候,与/usr/bin下面的原本的python2和pip命名区分,一般情况下别去动python2的软链接,会导致centos包管理工具yum命令出问题
ln -s /usr/local/py365/bin/python3.6 /usr/bin/python3
ln -s /usr/local/py365/bin/pip3 /usr/bin/pip3
5、网站地图、robots协议
robots.txt可以告诉搜索引擎网站哪些数据能爬,如果你想利于网站排名,尽量少disallow,sitemap.xml网站地图则是直接提交让搜索引擎增加收录,这两个文件/路径一般配在网站根目录下,可以直接写到nginx加两个路径指向就行了,主要用来优化网站,利于各加搜索引擎抓取网站信息,增加收录和网站排名
location /sitemap.xml {
alias /var/www/chengxuyuan_12_10/sitemap.xml;
}
location /robots.txt {
alias /var/www/chengxuyuan_12_10/robots.txt;
}
6、Django orm查询values
比如下方,我在查询时候只需要文章的id和title数据,则直接values查这两个字段就行,这样可以提高查询效率
Article.objects.values("id","title")
Q对象进行逻辑查询,也很常用
filter(Q(is_delete=0)&(Q(title__contains=a)|Q(title__contains=b)))
7、直接将一个字典保存mysql(键和列名一致)
dic = {"title": title, "time": arttime, "auth": auth, "con": con}
df = pd.DataFrame.from_dict(dic, orient='index').T
conn = get_local_engine("centos_test")
df.to_sql("这里是表名", conn, if_exists='append', index=False)
get_local_engine是我定义的一个获取engine的方法
def get_local_engine(dbname):
db_flag = "mysql"
host_ip = "127.0.0.1"
host_port = 3306
db_instance = dbname
user = "root"
pawd = "*************"
charset = "utf8"
engine_config = '%s%s%s%s%s%s%s%s%s%s%s' % ('mysql+pymysql://', user, ':', pawd, '@', host_ip, ':', host_port, '/', db_instance, '?charset=utf8')
engine = create_engine(engine_config, encoding=charset, max_overflow=10)
return engine
8、django admin站点引入富文本编辑器Kindeditor
1、kindeditor安装包直接放在项目static下面
2、在admin.py中加入这段js
3、kindeditor中config.js改成原本admin文本域的id,如下方截图圈到的
class Media:
#在管理后台的HTML文件中加入js文件,每一个路径都会追加STATIC_URL/
js = (
'kindeditor/kindeditor-all.js',
'kindeditor/lang.zh_CN.js',
'kindeditor/config.js',
)
点击咨询直接了解更多相关资料,我在惠州北大青鸟新方舟等你。
本文内容转载自网络,版权归原作者所有,如有侵权请联系我们进行删除。
标签:惠州计算机软件培训惠州计算件软件开发惠州计算机软件基础惠州计算机Python软件开发惠州Python培训学校惠州Python培训python基础教程python是什么python教程python入门
- 惠州计算机学校排行
- 标签列表
-
- Java (3694)
- 北大青鸟 (3713)
- 软件开发 (3613)
- JAVA (3413)
- UI设计入门 (2093)
- 惠州北大青鸟 (4375)
- 惠州IT培训 (2558)
- UI设计培训 (2090)
- 惠州UI设计培训 (2095)
- 惠州UI设计培训学校 (2090)
- 惠州计算机软件培训 (6260)
- 惠州计算件软件开发 (6260)
- 惠州计算机软件基础 (6261)
- 惠州计算机JAVA培训 (3574)
- 惠州计算机Java软件开发 (3620)
- 惠州计算机JAVA软件开发 (4645)
- 惠州计算机JAVA软件开发学校 (3338)
- 惠州计算机Java软件开发培训 (3338)
- 北大青鸟IT计算机学校 (5048)
- 北大青鸟IT软件学校 (5062)
- 北大青鸟IT学校 (5059)
- 惠州计算机UI设计软件开发 (2088)
- UI设计基础教程 (2088)
- UI设计是什么 (2088)
- UI设计教程 (2088)
- 网站分类
-
- 计算机教程
- 计算机入门
- 职业学校
- 新闻动态
- 专业课程
- 热门技术
- SEO
- 培训教程
- windows
- linux教程
- 系统集成
- 网站开发
- Html5
- 办公软件
- 师资力量
- 热点问答
- 联系我们
- 计算机学校
- 惠州计算机学校
- 河源计算机学校
- 广州计算机学校
- 深圳计算机学校
- 湛江计算机学校
- 佛山计算机学校
- IT计算机培训信息
- 设计专业
- UI
- 影视特效
- 游戏动漫设计
- Photoshop
- AI设计
- 软件教程
- Java技术
- C语言/C++语言培训
- C#
- Python技术
- PHP
- 数据库
- SQL Server
- 网络教程
- 网络安全
- 网络营销
- 软件专业
- 大数据专业
- 前端开发专业
- 软件测试专业
- Python专业
- 软件实施
- 珠海计算机学校
- 初中生学什么好
- 计算机认证
- 文章归档
-
- 2024年11月 (14)
- 2024年10月 (32)
- 2024年9月 (29)
- 2024年8月 (68)
- 2024年7月 (59)
- 2024年6月 (43)
- 2024年5月 (48)
- 2024年4月 (80)
- 2024年3月 (65)
- 2024年2月 (54)
- 2024年1月 (25)
- 2023年12月 (12)
- 2023年11月 (73)
- 2023年10月 (134)
- 2023年9月 (34)
- 2023年8月 (3)
- 2023年7月 (3)
- 2023年6月 (12)
- 2023年5月 (30)
- 2023年4月 (72)
- 2023年3月 (11)
- 2023年2月 (34)
- 2023年1月 (37)
- 2022年12月 (78)
- 2022年11月 (359)
- 2022年6月 (1193)
- 2022年5月 (570)
- 2022年4月 (1567)
- 2022年3月 (982)
- 2022年2月 (54)
- 2022年1月 (182)
- 2021年9月 (308)
- 2021年8月 (1704)
- 2021年7月 (2423)
- 2021年6月 (1806)
- 2021年5月 (1569)
- 2021年4月 (1380)
- 2021年3月 (1255)
- 2021年2月 (709)
- 2021年1月 (1521)
- 2020年12月 (3626)
- 2020年11月 (1646)
- 2020年10月 (1046)
- 2020年9月 (592)
- 最近发表
-
- 清远信息:2024年广清杯清远南粤家政技能大赛举行决赛|||计算机培训机构
- 汕尾信息:陈良川带队到汕尾技师学院调研|||计算机职业技能培训班
- 东莞信息:凤岗凤岗镇组织召开社保参保缴费及劳动用工政策宣讲会|||计算机软件培训学校
- 阳江信息:2024年度注册城乡规划师职业资格考试的合格标准是怎样的?|||计算机软件培训学校
- 阳江信息:职业技能提升补贴对象有哪些?|||大学生计算机培训学校
- 清远信息:清远市首家社保服务合作网点在清城区举办启动仪式|||计算机职业技能培训班
- 汕头信息:招聘658名中高端人才!2024年汕头市引进中高端人才专场招聘会举行|||北大青鸟计算机培训中心
- 东莞信息:广东省社保智能经办现场会在东莞召开|||大学生计算机培训学校
- 东莞信息:东坑镇举办2024年重点群体系列招聘活动|||计算机职业技能培训班
- 东莞信息:万江万江街道成功举办第四届粤菜师傅烹饪技能竞赛|||广州计算机编程培训