pandas自己的日期处理函数最通用的就是to_datetime,注意,pandas和python一样,没有单独处理日期的函数,它处理的日期格式是带时间的。
- 对于2023-7-22这样的字符串格式,可以用errors=coerce,能够一定程度上自动识别。
- 如果只有7/23这样的,就要用format('%m/%d)来标志,这里变换后年份是1900,需要根据实际年份做调整。用str转成字符串再replace?毕竟timedelta也只能处理day以下的时间段
- 纯数字日期可以用pd.to_datetime([0, 1, 2, 3], unit='D'),然后用origin=pd.Timestamp('2023-01-01'),但是timestamp只接受D,h,m,s这几种时间段。
- 从excel读出来的日期格式是数字,而且是日期戳,这和python处理的时间戳完全不通用,这时只能自己用函数转换
(日期-25569)*24*3600
。幸亏它们都是以1970年作为计算起点