scrapy 2.3 序列化格式
为了序列化 爬取 的数据,提要导出使用 Item exporters . 开箱即用支持这些格式:
- JSON
- 杰森线
- CSV
- XML
但是您也可以通过 FEED_EXPORTERS 设置。
JSON
- 价值
format 关键在 FEEDS 设置:json - 出口商:
JsonItemExporter - 见 this warning 如果您使用的是大型提要的JSON。
杰森线
- 价值
format 关键在 FEEDS 设置: jsonlines - 出口商:
JsonLinesItemExporter
CSV
- 价值
format 关键在 FEEDS 设置: csv - 出口商:
CsvItemExporter - 指定要导出的列及其顺序的步骤使用
FEED_EXPORT_FIELDS . 其他feed导出器也可以使用此选项,但对于csv很重要,因为与许多其他导出格式不同,csv使用固定头。
XML
- 价值
format 关键在 FEEDS 设置: xml - 出口商:
XmlItemExporter
泡菜
- 价值
format 关键在 FEEDS 设置: pickle - 出口商:
PickleItemExporter
元帅
- 价值
format 关键在 FEEDS 设置: marshal - 出口商:
MarshalItemExporter