scrapy 2.3 序列化格式
为了序列化 爬取 的数据,提要导出使用 Item exporters . 开箱即用支持这些格式:
- JSON
- 杰森线
- CSV
- XML
但是您也可以通过 FEED_EXPORTERS
设置。
JSON
- 价值
format
关键在 FEEDS
设置:json
- 出口商:
JsonItemExporter
- 见 this warning 如果您使用的是大型提要的JSON。
杰森线
- 价值
format
关键在 FEEDS
设置: jsonlines
- 出口商:
JsonLinesItemExporter
CSV
- 价值
format
关键在 FEEDS
设置: csv
- 出口商:
CsvItemExporter
- 指定要导出的列及其顺序的步骤使用
FEED_EXPORT_FIELDS
. 其他feed导出器也可以使用此选项,但对于csv很重要,因为与许多其他导出格式不同,csv使用固定头。
XML
- 价值
format
关键在 FEEDS
设置: xml
- 出口商:
XmlItemExporter
泡菜
- 价值
format
关键在 FEEDS
设置: pickle
- 出口商:
PickleItemExporter
元帅
- 价值
format
关键在 FEEDS
设置: marshal
- 出口商:
MarshalItemExporter