Tag: 多条记录

如何识别从多个订阅源收集的重复项目并在数据库中链接到它们

我有一个数据库,存储从许多站点获取的产品的详细信息,并通过各个站点API收集。 当我调用feed时,详细信息存储在数据库表中。 我遇到的问题是,因为卖家在很多网站上列出完全相同的产品,我最终在我的数据库中有重复的项目,然后当我在网页上显示它们时,有很多重复项。 问题是该项目没有任何明显的唯一标识符,它具有项目的具体细节(其中可能有许多),然后是来自卖方的项目描述。 我希望项目能够显示一次,然后向用户提供项目列表的其他位置的详细信息。 如何在不降低整个数据库速度的情况下识别出来的重复项? 然后,我如何从所有重复项中选择一个广告,然后存储广告所显示的其他网站。 谢谢你的帮助。