Zoals begrijpelijk is, is er sinds de lancering van ChatGPT en andere Large Language Models een stortvloed aan studies geweest waarin mogelijke toepassingen in de gastvrijheidssector worden onderzocht. Vaak gaat het dan om interactie met gasten (chatbots), of de inzet van AI door reizigers bij bijvoorbeeld het plannen van reizen. Nog los van het feit dat de huidige modellen nogal teleurstellend presteren bij het samenstellen van reizen, betwijfel ik hoe groot het probleem is dat hiermee wordt opgelost. Eigenlijk is dat een algemene indruk bij veel studies van de afgelopen jaren: we hebben een fantastische oplossing, maar we weten nog niet goed waarvoor.
Het interessante van Machine Learning in Hospitality: Interpretable Forecasting of Booking Cancellations, door wetenschappers uit Spanje en de VS, is de toepassing van AI en de manier waarop het wordt toegepast, op een relevant vraagstuk uit de beroepspraktijk. 10 tot 30 procent van hotelreserveringen wordt geannuleerd, wat kan leiden tot 20 procent omzetverlies. Dus als er criteria gevonden worden om de waarschijnlijkheid van een annulering in te schatten, vormen die een belangrijke aanvulling op de revenue managementinstrumenten van een hotel.
Nu kunnen AI-modellen een 'black box' vormen: ze produceren een uitkomst die lijkt te kloppen, maar we hebben geen idee waarom. Dat is problematisch, in de eerste plaats omdat de modellen dan niet gebruikt kunnen worden om een uitkomst te voorkomen. Als we weten dat een bepaalde reservering een grote kans heeft om geannuleerd te worden, maar we niet begrijpen waarom, kunnen we er geen beleid op maken. Ook de ethische kant van 'black box' modellen is problematisch. AI-modellen leren van data en kunnen daarom geneigd zijn te discrimineren. Bekend is het voorbeeld uit HR dat als managers vooral mannen zijn met een bepaalde achtergrond, AI daarvan een selectiecriterium kan maken en dus alleen kandidaten met die eigenschappen blijft selecteren. Als reserveringen als 'verdacht' worden aangemerkt omdat er een kans is dat ze geannuleerd worden, moeten we daarom begrijpen waarom ze dat stempel krijgen om soortgelijke discriminatie te vermijden. Om die reden bouwen de onderzoekers een 'interpreteerbaar' model.
Voor het model wordt stacked (gestapeld) modeling gebruikt. Daarbij worden eerst verschillende modellen getraind op de data, in dit geval reserveringsgegevens over twee jaar van een Spaans viersterrenhotel. De onderzoekers hebben acht verschillende machine learning technieken gebruikt. Bij machine learning worden modellen getraind met data om patronen te detecteren, zonder dat er van tevoren een algoritme bepaalt hoe de data geïnterpreteerd moeten worden. Het eerste gebruikte model is Logistic regression, dat op basis van inputvariabelen de waarschijnlijkheid van een gebeurtenis of uitkomst berekent. Een Decision Tree stelt als het ware een stroomdiagram op, waarbij bij elke vertakking de data wordt gesplitst op basis van een kenmerk, in twee groepen die dat kenmerk zo duidelijk mogelijk wel, of niet, bezitten. Random Forest maakt in feite een woud van Decision Trees, om met een veelvoud van beslissingen een meer accurate voorspelling te kunnen geven.
Gradient Boosting en XGBoost werken, net als het meer geavanceerde LightGBM, door zwakkere Decision Tree modellen te verbeteren door ze achter elkaar te schakelen; dit gebeurt in een herhaald proces, waarbij elke nieuwe boom de fouten van de vorige bomen probeert te corrigeren. Support Vector Machine is een techniek die een zo breed mogelijke marge zoekt tussen twee klassen in een verzameling. Een Multilayer Perceptron (MLP) is een type neuraal netwerk dat in de ingevoerde gegevens signalen leert te ontdekken, en de weging van deze signalen leert aan te passen om zo patronen te ontdekken en te voorspellen.
Het gestapelde model gebruikt een 'meta-model', een tweede machine learning model, om de voorspellingen te combineren. Het gestapelde model beslist zo welke individuele modellen in welke situaties het meest betrouwbaar zijn en hoe het hun voorspellingen moet combineren om de meest accurate uiteindelijke voorspelling te krijgen. SHapley Additive exPlanations (SHAP) waarden maken het vervolgens mogelijk om de invloed van afzonderlijke inputvariabelen te meten, zodat het model 'interpreteerbaar' wordt.
Dit zeer complexe model gebruikt een veelvoud aan variabelen om een zeer accurate voorspelling te maken van de kans dat een bepaalde reservering wordt geannuleerd. In dit specifieke geval, bleken boekingen uit Portugal, boekingen met een lange lead-time, voor standaardkamers een grotere kans op annulering te geven, en boekingen met premium opties (bijvoorbeeld een maaltijdkeuze) een lagere. Bedenk wel dat juist omdat het model zo geavanceerd is, deze uitkomsten niet kunnen worden gegeneraliseerd naar andere hotels; het gaat erom modellen te bouwen, die waarschijnlijk over een paar jaar worden geïntegreerd in uw reserveringssoftware.
Gómez-Talal, I., Azizsoltani, M., Talón-Ballestero, P. and Singh, A., 2025. Machine Learning in Hospitality: Interpretable Forecasting of Booking Cancellations. IEEE Access, https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=10857340
De onderzoekers zijn verbonden aan de Universidad Rey Juan Carlos in Madrid en aan de University of Nevada, Las Vegas.
Over de auteur
Dr. J.A. Oskam is Director Research Centre van Hotelschool The Hague
Blijf op de hoogte!
Twee keer per week het actuele en relevante hotelnieuws in uw mailbox? Registreer hier voor onze gratis digitale nieuwsbrief en blijf op de hoogte.