如果数据没有标题行,可用pandas添加默认的列名
不读取哪里数据,可用skiprows=[i],跳过文件的第i行不读取
第一次出现的保留,其余删除
最后一次出现的保留,其余删除
**对客户聊天记录进行分组**
**对符合多个条件进行分组**
需要对每一行进行权重设置,列表行数少可行,过存川误迅侵反测叫季参型多不可行
假设有4行数据,设置来自采样权重
自动生成数据的数量费迫她展,均值,标准差等数据
相关系数在-1到1之间,接近1为正相关,接近-1为负相关,0为不相关
参考书籍:
《利用pythonj进行360问答数据分析》
《从Excel到Python——数据分析进阶指南》