一、关于我

哈工大博士在读, 本硕博都是管理学,一个相当不务正业的文科生^_^。



二、关于Python

文科生视角,Python与不同语言的对比

  • Python vs C, Python语法最说人话,至于运行效率,讲真的,对文科生Python已经够用了。

  • Python vs R, 如果可以,一起学。让Python做采集与清洗的脏活,让R做漂亮的图表。

  • 其他语言没有系统学过,不好评述。



三、关于博客

博客阅读量惨淡,每天只有就两三个访问量,但可以整理资料,方便大家浏览及下载资料,也可留言交流,很值得去做的。

博客名大邓和他的Python,看起来挺奇怪的名字,其实在西方,公司名带有“&”、“and”字眼的都是挺大的公司,例如P&G。最初是希望把公众号做成个人品牌,输出自己对世界看法观点,同时又能分享Python技术。渐渐地发现,敲代码费脑但很享受,分享看法轻松却很无聊,遂逐渐聚焦于技术分享,这多少让公众号变的有些名不符实。



四、关于文本分析

16年刚入门Python之时,从导师所谈论的信息中,感觉经管领域蕴含着海量可供研究的文本数据,等待着大家去蒸馏出商业社会的真知灼见。

偶然间看到哲学家维特根斯一句话:“The limits of my language mean the limits of my world.",直译过来“我语言的边界就是我世界的边界”。我们的语言能力决定了我们对世界的认知和理解的范围。作为表达思想和情感的符号系统,语言和单词揭示了重要的信息。目前AI技术透过海量文本数据,已能窥探到人类认知层面的线索,如偏见(刻板印象)、群体态度、文化差异、文化变迁等。这很哇塞,涉及到方法论底层哲学,这让我很信服文本分析方法合理性和科学性。

目前文本分析相关概念有很多,如情感分析、话题分析、内容分析、文化组学(借用的基因组学)、文化变迁、语义分析、自然语言处理,所涉专业领域有自然语言处理、图书情报学、知识图谱、计算社会学、经管等。大家可以通过自己熟悉的领域接触,慢慢感受字里行间中反映出的人类认知信息。


在github上已已开源Python包有

  • GitHub User’s stars
  • 推荐这个,一直在更新中。



五、关于付费课

付费课 | Python实证指标与文本分析

5.1 为啥这门课要付费呀?

我要生活,需要挣钱。再者网上的免费资料也很多,我的博客里绝大多数分享都有代码可供下载,免费的内容也是很赞的。


5.2 课程值的学吗?

课程价格较高, 如不从事科研,这门课不建议购买。

如果是社科类领域科研工作者,这门课是值得的学的。这门课浓缩了近7年上万小时的人类无差别一般劳动,范围聚焦python、数据采集、文本分析等技术在社会科学(经管)科研中的最新应用场景。

干货的价值 » 付出的价格



六、关于付费数据

LIST | 可供社科(经管)领域使用的数据集汇总

5.1 数据集都是收费吗

大邓要花很多时间精力整理内容, 满足三个条件大邓会将数据集设置成收费数据集,即数据采集&清洗难度大文本分析上手困难科研用途价值大的数据


5.2 为啥你的这么贵呀?

大邓的数据集除了常见的介绍(记录数、字段、价格), 还包含pandas读取、词频统计、可视化等常用代码内容, 让你买到就能马上用到。

不止是数据,更在于数据集配套的python代码教程, 如



七、关于支持

七年了,大家的肯定&支持,是大邓分享至今的动力源泉。

希望下一个七年,继续欢迎亲们建言献策,欢迎亲们鼓励支持。

对了,博客下方有留言功能,不忙的话,立flag啥的只要有信息量正能量,也都是欢迎的。