码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 【temu】分析拼多多跨境电商Temu数据分析数据采集


    Temu是拼多多旗下跨境电商平台,于2022年9月1日在美国、加拿大、新加坡、中国台湾、中国香港等市场上线。本文作者从销售额、销量、产品分布等方面,对Temu产品进行了分析,一起来看一下吧。

    item_get获得商品详情
    
    item_review获得商品评论列表
    
    item_search按关键字搜索商品
    
    请求地址: http://wechat:17610352720.cn
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    数据采集

    采集的字段包括:商品名、商品id、原价、现价、一级分类、二级分类、店铺id、销量等;
    在这里插入图片描述
    上图是监控的temu数据中月销售额Top10的产品

    数据用途:

    • 量化分析
    • 投资分析
    • 跨境电商选品分析
    • 练手学习

    在这里插入图片描述
    上图为temu单品销量Top10,由于销量最大显示10万+,所以该统计意义不大。

    
    def send_request(url):
        proxy = ProxyClient.random_ip()
        session = requests.Session()
        proxies = {
            "http": f"http://{proxy}",
            "https": f"http://{proxy}"
        }
        cookies = {
            'region': '211',
            'language': 'en',
            'currency': 'USD',
            'timezone': 'Asia%2FShanghai',
            'shipping_city': '211%2C211000000022022',
        }
        headers = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:109.0) Gecko/20100101 Firefox/112.0',
            'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,*/*;q=0.8',
            'Accept-Language': 'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2',
        }
        response = session.get(
            url,
            headers=headers,
            proxies=proxies,
            cookies=cookies,
            # params=params,
            timeout=10,
            allow_redirects=False
        )
        # html = response.text
        raw_data1 = re.findall(r"window\.rawData\s*=\s*(\{.+?\});", response.text, re.DOTALL)
        raw_data = json.loads(raw_data1[0])
        print(raw_data)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33

    联系

    全量数据 定制开发

    感谢观看~

  • 相关阅读:
    vue本地开发设置代理连接本地后台服务
    MYSQL基础管理-auto_increment测试应用
    【跟小嘉学 Rust 编程】二十二、常用 API
    【C/C++数据结构 - 2】:稳定性与优化揭秘,揭开插入排序、希尔排序和快速排序的神秘面纱!
    电机控制算法
    python经典百题之矩阵对角线之和
    经典面试题 之 JVM调优
    栈和队列(c++)
    java计算机毕业设计计算机类专业考研交流学习平台MyBatis+系统+LW文档+源码+调试部署
    Java 开发环境配置
  • 原文地址:https://blog.csdn.net/qq_37275405/article/details/133908689
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号