1500字范文 > python爬取推特的详细教程_使用Selenium Python进行网页抓取[Twitter+Instagram]

python爬取推特的详细教程_使用Selenium Python进行网页抓取[Twitter+Instagram]

时间：2022-07-06 23:17:29

我正在尝试根据地理位置在Instagram和Twitter上进行网络抓取。

我可以运行一个查询搜索，但我在重新加载网页到more和存储字段到数据帧方面遇到了挑战。在

我确实找到了一些没有API密钥的web抓取twitter和Instagram的例子。但它们是关于标签关键字的。在

我正在努力在地理位置和旧约会之间刮蹭。到目前为止，我已经用python3.X编写了代码，并用anaconda编写了所有最新版本的包。在'''

Instagram - Components

"id": "1478232643287060472",

"dimensions": {"height": 1080, "width": 1080},

"owner": {"id": "351633262"},

"thumbnail_src": "https://instagram.fdel1-1./t51.2885-15/s640x640/sh0.08/e35/17439262_973184322815940_668652714938335232_n.jpg",

"is_video": false,

"code": "BSDvMHOgw_4",

"date": 1490439084,

"taken-at=213385402"

"display_src": "https://instagram.fdel1-1./t51.2885-15/e35/17439262_973184322815940_668652714938335232_n.jpg",

"caption": "Hakuna jambo zuri kama kumpa Mungu shukrani kwa kila jambo.. \ud83d\ude4f\ud83c\udffe\nIts weekend\n#lifeistooshorttobeunhappy\n#Godisgood \n#happysoul \ud83d\ude00",

"comments": {"count": 42},

"likes": {"count": 3813}},

'''

import selenium

from selenium import webdriver

#from selenium import selenium

from bs4 import BeautifulSoup

import pandas

#geotags = pd.read_csv("geocodes.csv")

#parmalink =

query = geocode%3A35.68501%2C139.7514%2C30km%20since:-03-01%20until:-03-02&f=tweets

twitterURL = '/search?q=' + query

#instaURL = "/explore/locations/213385402/"

browser = webdriver.Firefox()

browser.get(twitterURL)

content = browser.page_source

soup = BeautifulSoup(content)

print (soup)

对于Twitter搜索查询，我得到语法错误

对于Instagram，我没有得到任何错误，但我不能重新加载更多的帖子和写回csv数据帧。在

我也尝试在Twitter和Instagram中使用经纬度搜索。在

我有一个csv中的地理坐标列表，我可以使用该输入或编写搜索查询。在

任何方式来完成与位置刮擦将不胜感激。在

感谢你的帮助！！在

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。