共享电动车数据分析

项目概述: 这是一个基于 Hadoop MapReduce 的共享单车数据分析系统,用于分析不同地区在不同季度的单车使用情况。 项目使用分布式计算框架处理大规模数据,将处理后的数据进行分析总结,为共享电动车运营提供数据支持。

使用技术
编程语言:Java
数据处理框架:Hadoop MapReduce
输入输出格式:Text/IntWritable

数据来源:使用Python模拟生成广东省各地区各季度的共享电动车使用记录,共一千万条数据

数据处理流程
Mapper 阶段:
  读取输入数据(共享电动车使用记录)
  提取地区信息作为key
  统计使用次数作为value
Reducer 阶段:
  接收相同地区的所有记录
  汇总该地区的总使用次数
  输出格式:季度+地区名称+使用次数

输出结果 例: