• 图纸下载
  • 专业文献
  • 行业资料
  • 教育专区
  • 应用文书
  • 生活休闲
  • 杂文文章
  • 范文大全
  • 作文大全
  • 达达文库
  • 文档下载
  • 音乐视听
  • 创业致富
  • 体裁范文
  • 当前位置: 达达文档网 > 行业资料 > 正文

    NLP在银行网络金融业务中的应用

    时间:2020-12-10 04:43:48 来源:达达文档网 本文已影响 达达文档网手机站

    张彦超 王杰 陈生 王彦博

    后疫情时代,数字经济的重要性日益凸显。习近平总书记多次强调要加速建设数字中国,更好地服务我国经济社会发展和改善人民生活。数字经济时代的到来,一方面有望重塑商业银行整体格局,打破传统信贷的垄断格局,深度洞察和充分挖掘客户需求将成为商业银行创新发展的必由之路;另一方面,随着金融科技异军突起,商业银行在科技与业务深度融合的过程中有了更加丰富的决策选项。其中,以NLP(Natural Language Processing,自然语言处理)情感分析技术为代表的人工智能技术,得益于其对于客户信息挖掘和分析能力的优秀表现,有利于银行建立统一视图的客户信息体系、保持自身的长期战略定位,引起业界的高度关注。在金融科技时代,对于大部分金融机构而言,非结构化数据的占比已达到银行信息总量的80%,甚至更高。但由于该类数据的存储格式不统一、存储位置分散、数据量大且增长速度快,而处于长期“睡眠状态”。有效利用NLP技术深度挖掘非结构化数据,不仅有助于商业银行深入洞察客户需求、优化业务流程,而且可以对银行提升自身治理能力起到关键作用。我们聚焦于NLP情感分析技术在我国商业银行网络金融业务场景中的实际应用,以期为数字经济时代商业银行金融科技的发展提供借鉴。

    基于NLP的情感分析技术简述

    NLP作为人工智能的一个热门领域,凭借其在与人类交互中体现出的独有价值和魅力,往往被誉为人工智能皇冠上的明珠。从业界应用来看,NLP情感分析在客户评价以及网络舆情分析等方面表现出良好的应用效果。通过对文本或音频的关键词提取并进行情感分析可以有效地从大量的评论数据中获取有效信息,从而获得对服务的有效反馈,有针对性地进行改进。

    NLP情感分析的研究路径可大致划分为“基于词典和规则的方法”和“基于多类标分类的机器学习方法”。对于情绪分类问题,最早有人采用KNN(K-NearestNeighbor,K最近邻)算法,通过学习标注数据来识别句子中的情绪类别;也有人采用SVM(Support Vector Machine,支持向量机)算法,通过文本标注建模的方法来识别语料中的情绪标签。上述方法只能挑选出情绪标签,无法反映每种情绪属性的强烈程度。当前普遍采用的方法是用参数量较多的深度学习模型结构,对文本进行上下文关联建模,提取更深层的语义信息,并最终计算出所有情绪的极性强弱,再根据各情绪的极性强弱挑选出极性最强的情绪作为文本的情绪标签。NLP情感分析的具体流程如图1所示。

    网络金融NLP情感分析的应用

    我们聚焦于运用NLP情感分析技术对商业银行网络金融业务中的客户评价以及网络舆情进行监测分析。情绪分类的对象是一段语料中所蕴含的主体情绪,是对蕴含主观情感色彩的文本进行分析、处理、归纳以及推理的过程。商业银行日常经营活动中产生了大量的、对于银行服务和产品有价值的评论信息。例如,工单数据中不仅包括具体问题,还包括处理方法、过程、结果以及客户反馈,是较好的文本数据。该类评论信息中往往可以体现出客户的批评、赞扬等多种主观情感表现。采用NLP技术将客户评论中包含的情感进行量化分析,有利于银行客观评价服务质量并进行后续的改进和提升。以某银行为例,NLP情感分析可以根据手机银行客户点评的内容分析出客户的情绪是正面、中性还是负面(见表1)。

    根据商业银行手机银行客户的点评内容,NLP情感分析会通过以下流程将点评内容转化为点评情绪信息。

    数据收集和预处理

    对于银行而言,其非结构化数据来源包括网上银行及手机银行中的客户点评、客户咨询、网络舆情等。在收集行内外相关数据后,NLP情感分析技术将对文本进行预处理,一般包括文本清洗、去停用词及符号等。

    如果对数据分类采用的是有监督学习(从标签化训练数据集中推断出函数的机器学习任务)这一方式,需要对数据进行前期的人工标注工作,采用交叉验证、算法模型结合反馈的方式可以保证数据标注的准确性。标注数据一般分为以下四个部分。一是标注训练数据。用于模型初步训练,包括文本内容和图片内容两部分。二是训练测试数据。每次训练过程中,需要简单验证模型的各个指标,包括但不限于准确率、召回率和F1等指标。三是扩充标注数据。主要针对前期标注过程中的分布相关问题,对数据分布不均衡问题进行调整,这也是对模型泛化能力的一个优化手段。四是标注测试数据。这是为最终确定验收、测算指标而选取的测试数据,也可以作为后期优化迭代的测试数据集。

    特征提取

    通过对特征提取进行深入研究,可以很好地提取出海量数据中蕴含的文本信息和图像信息的重要特征。一般而言,文本的特征提取可以通过 word2vec、glove、Elmo、BERT 等预训练方式,将文本信息有效地转化为计算机可以识别的向量信息。需要注意的是,word2vec、glove 等方法难以解决中文中一词多义的问题,如“苹果”一词在不同语境下可能代表手机品牌或水果,这是由于 word2vec 和 glove 训练出来的词向量只能反映出一个固定的语义。但是,Elmo 和 BERT 等预训练模型可以通过保存上下文语义的方式很好地解决一词多义的问题。

    数据分类

    当前主流的数据分类研究方向包括单模态和多模态两种,内容涵盖敏感图片识别、敏感文本信息识别和图像、文本融合的多模态敏感数据识别等。对于单模态文本信息识别,可以通过包括LSTM、BERT、Xlnet等深度学习以及预训练模型相结合的有监督学习方式实现95%以上敏感信息的分类提取。在多模态领域,可以采用对文本信息和图像信息特征提取相结合的方式实现数据敏感信息的分类提取。特征提取一般可以得到普通特征和聚合特征。通常而言,普通特征主要为页面、文本、图像和标题等单纯特征;聚合特征则将各个普通特征进行組合和有监督训练,转换为多个子模型,然后将这些子模型的输出作为聚合特征,将这些聚合特征分类可以实现90%以上的敏感分类识别。

    模型训练或模型预训练

    深度学习常见的模型结构包括RNN(Recurrent Neural Network, 循环神经网络)、CNN(Convolutional Neural Networks,卷积神经网络)、Google提出的Transformer结构和很多基于它们实现的变形结构。不同的学习模型各有利弊,RNN、CNN、LSTM等模型的特点在于其具备强大的序列建模能力。

    模型预训练阶段采用BERT模型。Google于2018年推出BERT模型,BERT模型是基于大规模语料的LM预训练模型,BERT预训练模型具有强大的特征提取能力,可以很好地解决不同语境下的一词多义问题,具有很强的鲁棒性(控制系统在一定的参数摄动下,维持其他某些性能的特性)和泛化能力(机器学习算法对新鲜样本的适应能力)。在模型训练之前需要有针对性地使用具体应用场景下银行的自有数据,从相关数据库中采集一批数据进行深入的预训练,使得所构建的模型在项目场景下具备很强的鲁棒性,然后在人工标注的训练集上进行模型训练。通过不断迭代优化参数的方式得到最佳模型,以达到90%以上的准确率。

    优化调整

    NLP情感分析会根据不同的指标对模型进行评估,模型的评价指标主要有准确率、错误率、召回率、精准度、F1值、ROC和AUC曲线等,根据评估的结果对模型进行优化调整。在机器学习过程中,主要应用于梯度下降(迭代法的一种,可以用于求解最小二乘问题),如传统的优化器主要结合数据集,通过变化单次循环所采用的数据量的大小对梯度下降进行控制;非传统的调优则综合考量数据集特点与模型训练时间,通过多种方式实现梯度下降的学习率。常见的优化器有SGD、BGD、MBGD、Momentum、Adagrad、RMSprop、Adam等。

    实证结果

    基于上述实证研究,我们对目标银行2020年6月至2020年8月千余条客户点评的文本数据进行分析,对每条点评生成的情感分析结果进行判断。从模型效果指标来看,长文本和短文本测试结果的准确率如表2、表3所示,效果显著。

    从业务方面看,以某商业银行正面情绪的语料分析为例,通过NLP分析技术可生成词云,进行可视化展现,一方面可供业务管理部门第一时间掌握用户反馈信息,把握舆情动态;另一方面可根据客户反馈的意见,及时对业务进行优化,并有针对性地与客户进行沟通,把握先手棋,提升客户体验。具体来看,在交互方式方面,客户高度关注手机银行的便捷性和易用性,以指纹识别、人脸识别等为代表的生物识别方式对提升用户体验具有较为显著的作用。针对不同的客户反馈,后续手机银行登录界面将推送个性化的登录方式选项,并在登录首页进行差异化的功能设定,以提升手机银行的便捷性。在客户感受方面,客户对手机银行的版本迭代有较高的期待,页面版本优化所带来的功能提升和视觉更新往往更容易得到用户的认可。普遍来看,清新简洁的风格在用户中受欢迎程度较高,为后续手机银行的视觉设计风格提供了重要的参考依据。在获客引流方面,信用卡、日常转账和存款是手机银行用户激活的主要业务,后续获客过程中持续优化信用卡的便捷性、拓展日常支付场景有望成为客群增长的重要路径。

    结语

    一直以来,由于NLP技术可以实现针对文本、语音等非结构化数据的价值挖掘,因此在营销、运营等场景中可以对智能化决策进行支持。我们聚焦于某商业银行网络金融业务手机银行客户的反馈数据,基于NLP情感分析技术对客户点评进行标注和识别,并将此分析结果转化为业务建议,辅助银行进行客群管理与经营,以提升银行的服务能力。

    (文章仅代表个人观点,与所在单位无关)

    (作者张彦超、王杰工作单位為华夏银行股份有限公司, 陈生、王彦博工作单位为龙盈智达(北京)科技有限公司)

    相关热词搜索: 金融业务 银行 网络

    • 生活居家
    • 情感人生
    • 社会财经
    • 文化
    • 职场
    • 教育
    • 电脑上网