On Optimization of Sequential Decision-Making in Customer Relationship Management using Deep Reinforcement Learning

Customer relationship management (CRM) is a fickle but pivotal elementto the success of any business. Used correctly, it can not only yield higherrevenue and lower operational costs, but significantly boost customersatisfaction. Nonetheless, it can also be mismanaged—sacrificing thewell-being of cus...

Full description

Bibliographic Details
Main Author: Ryan, Christian
Format: Others
Language:English
Published: KTH, Skolan för elektroteknik och datavetenskap (EECS) 2019
Subjects:
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-261711
id ndltd-UPSALLA1-oai-DiVA.org-kth-261711
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-kth-2617112019-10-11T04:37:01ZOn Optimization of Sequential Decision-Making in Customer Relationship Management using Deep Reinforcement LearningengRyan, ChristianKTH, Skolan för elektroteknik och datavetenskap (EECS)2019Engineering and TechnologyTeknik och teknologierCustomer relationship management (CRM) is a fickle but pivotal elementto the success of any business. Used correctly, it can not only yield higherrevenue and lower operational costs, but significantly boost customersatisfaction. Nonetheless, it can also be mismanaged—sacrificing thewell-being of customers for profitability. Industries have thereby beenflooded with a range of different heuristic strategies that aim to optimizeCRM. This thesis aims to instead study and optimize CRM using a datadrivenapproach, and present a framework that can readily incorporatecustomer well-being into the optimization process. More specifically: cana strategy that outperforms a business’ current strategy without any realworldimplications be derived using modern advances in reinforcementlearning? In this context, the lifetime value (LTV), i.e. net profit, of acustomer will be used as the objective function to optimize for.Using deep feed-forward neural networks, an artificial environmentmimicking typical customer behavior was attained. The model’s predictivecapabilities deviated merely a couple of percent from the true averagecustomer behavior seen in the data. This was further leveraged byan algorithm to obtain a business strategy through reinforcement learning.This novel algorithm is based on deep Q-networks, with furtherdomain-specific additions such as combined experience replay and doublelearning. The algorithmically derived business strategy theoreticallyoutperformed the current state-of-the-art business strategy by approximately100 percent in average 2-year LTV, and further outperformed aplethora of different business strategies. Customer relationship management (CRM) är en labil men väsentligframgångsfaktor inom affärsverksamheten. Om det nyttjas korrekt kandet leda till högre omsättning, lägre driftskostnader och en förbättradkundnöjdhet. Följaktligen, kan det även missbrukas, där kundhälsa uppoffrasför ekonomisk lönsamhet. Därför är det viktigt att granska CRMfrån ett nytt perspektiv. Denna masteravhandling ämnar sig åt att studeraoch optimera CRM genom ett datadrivet tillvägagångssätt, samtpresentera ett ramverk som kan enkelt inlemma kundhälsa i optimeringssteget.Mer specifikt: kan en affärsstrategi härledas som kan utkonkurreraen existerande affärsstrategi för ett företag utan några verkligakonsekvenser genom att tillämpa moderna framgångar inom förstärkandeinlärning? Inom denna kontext nyttjas lifetime value (LTV), alltsånettovinst per kund som optimeringsvariabel.Genom att använda framåtmatande artificiella neuronnät kunde enkonstgjord miljö som imiterar typisk kundbeteende etableras. Denna modellsprediktiva förmåga avvek enbart ett par procent från det sanna genomsnittligakundbeteendet. Denna miljö nyttjades sedan av dubbla djupaQ-nätverk med kombinerad erfarenhetsuppspelning för att åstadkommaen affärsstrategi genom förstärkande inlärning. Denna affärsstrategipresterade omkring 100 procent bättre än den existerande affärsstrategini uppnådd 2-årig LTV samt utkonkurrerade flertalet andra triviala ochicke-triviala affärsstrategier. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-261711TRITA-EECS-EX ; 2019:537application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language English
format Others
sources NDLTD
topic Engineering and Technology
Teknik och teknologier
spellingShingle Engineering and Technology
Teknik och teknologier
Ryan, Christian
On Optimization of Sequential Decision-Making in Customer Relationship Management using Deep Reinforcement Learning
description Customer relationship management (CRM) is a fickle but pivotal elementto the success of any business. Used correctly, it can not only yield higherrevenue and lower operational costs, but significantly boost customersatisfaction. Nonetheless, it can also be mismanaged—sacrificing thewell-being of customers for profitability. Industries have thereby beenflooded with a range of different heuristic strategies that aim to optimizeCRM. This thesis aims to instead study and optimize CRM using a datadrivenapproach, and present a framework that can readily incorporatecustomer well-being into the optimization process. More specifically: cana strategy that outperforms a business’ current strategy without any realworldimplications be derived using modern advances in reinforcementlearning? In this context, the lifetime value (LTV), i.e. net profit, of acustomer will be used as the objective function to optimize for.Using deep feed-forward neural networks, an artificial environmentmimicking typical customer behavior was attained. The model’s predictivecapabilities deviated merely a couple of percent from the true averagecustomer behavior seen in the data. This was further leveraged byan algorithm to obtain a business strategy through reinforcement learning.This novel algorithm is based on deep Q-networks, with furtherdomain-specific additions such as combined experience replay and doublelearning. The algorithmically derived business strategy theoreticallyoutperformed the current state-of-the-art business strategy by approximately100 percent in average 2-year LTV, and further outperformed aplethora of different business strategies. === Customer relationship management (CRM) är en labil men väsentligframgångsfaktor inom affärsverksamheten. Om det nyttjas korrekt kandet leda till högre omsättning, lägre driftskostnader och en förbättradkundnöjdhet. Följaktligen, kan det även missbrukas, där kundhälsa uppoffrasför ekonomisk lönsamhet. Därför är det viktigt att granska CRMfrån ett nytt perspektiv. Denna masteravhandling ämnar sig åt att studeraoch optimera CRM genom ett datadrivet tillvägagångssätt, samtpresentera ett ramverk som kan enkelt inlemma kundhälsa i optimeringssteget.Mer specifikt: kan en affärsstrategi härledas som kan utkonkurreraen existerande affärsstrategi för ett företag utan några verkligakonsekvenser genom att tillämpa moderna framgångar inom förstärkandeinlärning? Inom denna kontext nyttjas lifetime value (LTV), alltsånettovinst per kund som optimeringsvariabel.Genom att använda framåtmatande artificiella neuronnät kunde enkonstgjord miljö som imiterar typisk kundbeteende etableras. Denna modellsprediktiva förmåga avvek enbart ett par procent från det sanna genomsnittligakundbeteendet. Denna miljö nyttjades sedan av dubbla djupaQ-nätverk med kombinerad erfarenhetsuppspelning för att åstadkommaen affärsstrategi genom förstärkande inlärning. Denna affärsstrategipresterade omkring 100 procent bättre än den existerande affärsstrategini uppnådd 2-årig LTV samt utkonkurrerade flertalet andra triviala ochicke-triviala affärsstrategier.
author Ryan, Christian
author_facet Ryan, Christian
author_sort Ryan, Christian
title On Optimization of Sequential Decision-Making in Customer Relationship Management using Deep Reinforcement Learning
title_short On Optimization of Sequential Decision-Making in Customer Relationship Management using Deep Reinforcement Learning
title_full On Optimization of Sequential Decision-Making in Customer Relationship Management using Deep Reinforcement Learning
title_fullStr On Optimization of Sequential Decision-Making in Customer Relationship Management using Deep Reinforcement Learning
title_full_unstemmed On Optimization of Sequential Decision-Making in Customer Relationship Management using Deep Reinforcement Learning
title_sort on optimization of sequential decision-making in customer relationship management using deep reinforcement learning
publisher KTH, Skolan för elektroteknik och datavetenskap (EECS)
publishDate 2019
url http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-261711
work_keys_str_mv AT ryanchristian onoptimizationofsequentialdecisionmakingincustomerrelationshipmanagementusingdeepreinforcementlearning
_version_ 1719263917592543232