垃圾邮件识别方法和识别系统、以及过滤系统.pdf 立即下载
2023-06-05
约1.6万字
约20页
0
4.6MB
举报 版权申诉
预览加载中,请您耐心等待几秒...

垃圾邮件识别方法和识别系统、以及过滤系统.pdf

201210442421.pdf

预览

免费试读已结束,剩余 15 页请下载文档后查看

10 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号(10)申请公布号CNCN103812826103812826A(43)申请公布日2014.05.21(21)申请号201210442421.0(22)申请日2012.11.08(71)申请人中国电信股份有限公司地址100033北京市西城区金融大街31号(72)发明人于洪涌郭涛张京晖(74)专利代理机构中国国际贸易促进委员会专利商标事务所11038代理人孙宝海(51)Int.Cl.H04L29/06(2006.01)H04L12/58(2006.01)权权利要求书3页利要求书3页说明书10页说明书10页附图6页附图6页(54)发明名称垃圾邮件识别方法和识别系统、以及过滤系统(57)摘要本发明公开了一种基于用户通信行为的垃圾邮件识别方法和识别系统、以及过滤系统,涉及反垃圾邮件技术领域。其中方法包括提取接收的电子邮件的发件人和收件人的电子邮件地址;根据发件人和收件人的电子邮件地址,在用户通信系数库中查找是否存在该发件人相对于该收件人的用户通信系数,用户通信系数基于用户通信行为构建,表示该收件人与该发件人的联系程度;如果存在对应的用户通信系数,根据用户通信系数确定电子邮件对该收件人来说是否为垃圾邮件。这种基于用户通信行为的垃圾邮件识别方案不宜被规避,并且充分考虑用户个性化的通信关系,提高了垃圾邮件识别和过滤的准确性。CN103812826ACN103826ACN103812826A权利要求书1/3页1.一种垃圾邮件识别方法,包括:提取接收的电子邮件的发件人和收件人的电子邮件地址;根据发件人和收件人的电子邮件地址,在用户通信系数库中查找是否存在该发件人相对于该收件人的用户通信系数,用户通信系数基于用户通信行为构建,表示该收件人与该发件人的联系程度;如果存在对应的用户通信系数,根据所述用户通信系数确定所述电子邮件对该收件人来说是否为垃圾邮件。2.根据权利要求1所述的方法,其特征在于,在接收所述电子邮件之前,还包括基于用户通信行为信息建立用户通信行为向量库和用户通信系数库的操作,具体包括:采集用户通信行为信息;根据采集的用户通信行为信息形成用户通信行为向量,并将用户通信行为向量保存到用户通信行为向量库中;根据用户通信行为向量形成用户通信系数,并将用户通信系数保存到用户通信系数库中。3.根据权利要求2所述的方法,其特征在于,所述采集用户通信行为信息的操作具体包括:接收用户通过终端上传的用户通信行为信息,所述用户通信行为信息包括联系人邮箱和电话号码的对应关系、黑白名单数据、语音通信数据、短信通信数据和电子邮件通信数据,所述黑白名单数据包括用户通讯录黑白名单,所述语音通信数据包括拒接电话、电话通话频率和主动拨出电话频率,所述短信通信数据包括短信通信频率、主动发送短信频率、设为垃圾短信的电话号码,所述电子邮件通信数据包括邮件收发频率、主动发送邮件频率、设为垃圾邮件的电子邮件地址。4.根据权利要求2所述的方法,其特征在于,所述根据采集的用户通信行为信息形成用户通信行为向量的操作具体包括:从用户通信行为信息中提取用户的电子邮箱地址和电话号码,形成以该电子邮箱地址为主索引的用户通信行为向量,并将该用户的电话号码添加到该用户通信行为向量中;从用户通信行为信息中提取该用户的联系人的电子邮箱地址,形成以联系人的电子邮箱地址为副索引的用户通信行为向量的子向量;根据用户通信行为信息形成子向量的分量。5.根据权利要求4所述的方法,其特征在于,所述根据用户通信行为信息形成子向量的分量的操作具体包括:根据采集的用户通信行为信息中的黑白名单数据,生成黑白名单分量,以表示联系人是该用户的黑名单用户或白名单用户;根据采集的用户通信行为信息中的语音通信数据,生成语音分量,以表示用户与联系人之间的通话频率和用户对联系人来电的响应积极程度;根据采集的用户通信行为信息中的短信通信数据,生成短信分量,以表示用户与联系人之间的短信联系频率和用户对联系人的短信的响应积极程度;根据采集的用户通信行为信息中的电子邮件通信数据,生成电子邮件分量,以表示用户与联系人之间的邮件联系频率和用户对联系人的邮件的响应积极程度。2CN103812826A权利要求书2/3页6.根据权利要求2所述的方法,其特征在于,所述根据用户通信行为向量形成用户通信系数的操作具体为:将用户通信行为向量中用户与联系人子分量所属的各分量按照各自的权值进行加权求和运算;根据运算结果确定用户通信系数,以表示用户与该联系人的联系程度。7.根据权利要求1所述的方法,其特征在于,所述根据所述用户通信系数确定所述电子邮件对该收件人来说是否为垃圾邮件还包括:根据所述电子邮件的关键字或邮件结构与预先设置的垃圾邮件的邮件特征进行匹配得到匹配结果;根据所述用户通信系数和所述
查看更多
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

垃圾邮件识别方法和识别系统、以及过滤系统

文档大小:4.6MB

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
全场最划算
12个月
199.0
¥360.0
限时特惠
3个月
69.9
¥90.0
新人专享
1个月
19.9
¥30.0
24个月
398.0
¥720.0
6个月会员
139.9
¥180.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用