非平稳类别数据优先级排序

发布:2025年12月23日 09:23
1分で読める
r/datascience

分析

这篇文章描述了一个实际问题,即在特征是类别型、目标是二元变量,并且分数随时间推移而变化的待办事项列表中对项目进行优先级排序。核心挑战在于数据是非平稳的,这意味着特征与目标之间的关系会随着时间推移而变化。作者正在寻求关于合适的建模方法以及如何处理训练和测试以反映推理过程的建议。这个问题定义明确,突出了在动态环境中使用机器学习的复杂性。

引用

重要的是,模型不是试图预测项目随时间如何演变。每个分数都旨在回答一个静态问题:“考虑到我们现在所知道的一切,我们应该如何相对于其他项目优先考虑这个项目?”