title: 1.5G数据集 | 200万条Indiegogo众筹项目信息
author: 大邓
date: '2022-10-16'
slug: []
categories: []
tags:
  - 文本分析
  - 数据集
cover:
    image: images/blog/indiegogo-dataset.jpeg
description: 1.57G indiegogo-dataset.jpeg
keywords:
  - Python
  - 文本分析
  - 经济管理
  - 众筹网站
  - indiegogo
draft: no
type: post

Indiegogo

Indiegogo成立于2008年,全球最大的科创新品首发和众筹平台, 是美国最早的众筹平台之一。



参考论文

该数据集研究价值,可用于研究市场营销、创新创业、信息管理等, 部分使用众筹数据集作为研究对象的论文。

[1]王伟,陈伟,祝效国,王洪伟. 众筹融资成功率与语言风格的说服性-基于Kickstarter的实证研究.管理世界.2016;5:81-98. [2]Dai, Hengchen and Dennis J. Zhang. “Prosocial Goal Pursuit in Crowdfunding: Evidence from Kickstarter.” Journal of Marketing Research 56 (2019): 498 - 517. [3]Gafni, H., Marom, D.M., Robb, A.M., & Sade, O. (2020). Gender Dynamics in Crowdfunding (Kickstarter): Evidence on Entrepreneurs, Backers, and Taste-Based Discrimination*. Review of Finance. [4]Jensen, Lasse Skovgaard and Ali Gürcan Özkil. “Identifying challenges in crowdfunded product development: a review of Kickstarter projects.” Design Science 4 (2018): n. pag.



Indiegogo数据

2016年4月写好的Indiegogo爬虫,每月执行一次, 最新的数据 可以前往https://webrobots.io/indiegogo-dataset/



‘原始’数据

Web Robot网上公开的的Indiegogo原始数据几十个 csv文件,



整理

将上图的zip全部合并为一个 Indiegogo_dataset.csv , 该文件 1.57G 。

import pandas as pd
import warnings
warnings.filterwarnings('ignore')

dff = pd.read_csv('Indiegogo_Dataset/Indiegogo_dataset.csv', on_bad_lines='skip')
dff.head()

Run


数据集的字段有

df.columns

Run

Index(['bullet_point', 
       'category', 'category_url',  #项目类目及url
       'clickthrough_url', #进入当前项目经由的某url
       'close_date',  #项目截止日期
       'currency',  #货币
       'funds_raised_amount',  #当前已筹集的资金
       'funds_raised_percent', #筹集资金进度(当前筹资/项目目标金额)
       'image_url',  #图片url
       'is_indemand', 
       'is_pre_launch', #是否为预演
       'offered_by',  #项目发起人
       'open_date', #项目开始日期
       'perk_goal_percentage', 'perks_claimed', 
       'price_offered', #众筹价
       'price_retail', #零售价
       'product_stage',  #产品阶段
       'project_id', #项目id
       'project_type', #项目类型
       'source_url', #项目url
       'tagline', 'tags', #标签
       'title' ], #项目标题
      dtype='object')



数据获取



广而告之