This paper presents the key algorithmic techniques behind CatBoost, a new gradient boosting toolkit. Their combination leads to CatBoost outperforming other publicly available boosting implementations in terms of quality on a variety of datasets. Two critical algorithmic advances introduced in CatBoost are the implementation of ordered boosting, a permutation-driven alternative to the classic algorithm, and an innovative algorithm for processing categorical features. Both techniques were created to fight a prediction shift caused by a special kind of target leakage present in all currently existing implementations of gradient boosting algorithms. In this paper, we provide a detailed analysis of this problem and demonstrate that proposed algorithms solve it effectively, leading to excellent empirical results.
Given a repeatedly issued query and a document with a notyet-confirmed potential to satisfy the users' needs, a search system should place this document on a high position in order to gather user feedback and obtain a more confident estimate of the document utility. On the other hand, the main objective of the search system is to maximize expected user satisfaction over a rather long period, what requires showing more relevant documents on average. The state-of-the-art approaches to solving this exploration-exploitation dilemma rely on strongly simplified settings making these approaches infeasible in practice. We improve the most flexible and pragmatic of them to handle some actual practical issues. The first one is utilizing prior information about queries and documents, the second is combining bandit-based learning approaches with a default production ranking algorithm. We show experimentally that our framework enables to significantly improve the ranking of a leading commercial search engine.
Online evaluation methods, such as A/B and interleaving experiments, are widely used for search engine evaluation. Since they rely on noisy implicit user feedback, running each experiment takes a considerable time. Recently, the problem of reducing the duration of online experiments has received substantial attention from the research community. However, the possibility of using sequential statistical testing procedures for reducing the time required for the evaluation experiments remains less studied. Such sequential testing procedures allow an experiment to stop early, once the data collected is sufficient to make a conclusion. In this work, we study the usefulness of sequential testing procedures for both interleaving and A/B testing. We propose modified versions of the O'Brien & Fleming and MaxSPRT sequential tests that are applicable for testing in the interleaving scenario. Similarly, for A/B experiments, we assess the usefulness of the O'Brien & Fleming test, as well as that of our proposed MaxSPRT-based sequential testing procedure. In our experiments on datasets containing 115 interleaving and 41 A/B testing experiments, we observe that considerable reductions in the average experiment duration can be achieved by using our proposed tests. In particular, for A/B experiments, the average experiment durations can be reduced by up to 66% in comparison with a single step test procedure, and by up to 44% in comparison with the O'Brien & Fleming test. Similarly, a marked relative reduction of 63% in the duration of the interleaving experiments can be achieved.
Implicit user feedback is known to be a strong signal of user preferences in web search. Hence, solving the explorationexploitation dilemma [5] became an important direction of improvement of ranking algorithms in the last years. In this poster, in the case of commercial queries, we consider a new negative effect of exploration on the user utility-distracting and confusing users by shifting well-known documents from their common positions-and propose an approach to take it into account within Multi-Armed Bandit algorithms, usually applied to solve the dilemma.
Инженерно-строительный журнал, №9, 2013 МОДЕЛИВоробьев А.В., Кашеварова Г.Г. Адаптивные модели краткосрочного прогноза оседания земной поверхности и определение наиболее неблагоприятного положения здания в мульде сдвижения Адаптивные модели краткосрочного прогноза оседания земной поверхности и определение наиболее неблагоприятного положения здания в мульде сдвижения Аспирант А.В. Воробьев; Д.ф.-м.н., зав. кафедрой Г.Г. Кашеварова, ФГБОУ ВПО «Пермский национальный исследовательский политехнический университет» Аннотация. Для оценки механической безопасности и возможности дальнейшей эксплуатации зданий, расположенных на подработанной территории, требуется прогноз оседаний земной поверхности. Процесс оседания земной поверхности изучается путем применения адаптивных моделей краткосрочного прогнозирования временных рядов. Цель адаптивных методов прогнозирования заключается в построении самонастраивающихся математических моделей, которые способны отражать изменяющиеся во времени условия и давать достаточно точные оценки будущих членов данного ряда. Такие модели предназначаются, прежде всего, для краткосрочного прогнозирования.Выбор подходящей модели прогнозирования осуществлен на основе сравнения прогнозных значений с натурными данными по оседаниям контрольных реперов. Из анализа результатов моделирования следует, что наиболее близким по значению к фактической величине оседания является результат прогноза с использованием модели Хольта.Выполнен ряд численных экспериментов, в результате которых установлено наименее благоприятное положение пятиэтажного панельного здания в мульде сдвижения, а также определено напряженно-деформированное состояние типовой секции панельного здания. Результаты численных экспериментов подтверждаются данными обследований.Ключевые слова: адаптивная модель прогнозирования; подработанная территория; оседание поверхности; мульда сдвижения; метод конечных элементов ВведениеЗадачу прогнозирования различных социально-экономических процессов решает практически каждый экономист вне зависимости от области его исследования. Но в настоящее время в России остро стоит проблема предупреждения чрезвычайных ситуаций, ежегодно наносящих серьезный экономический ущерб многим регионам. Появились работы, посвященные прогнозу возникновения чрезвычайных ситуаций путем постоянного наблюдения и анализа их параметров [1-6].Для Пермского края особенно актуальной является тема эксплуатации зданий и сооружений на подработанной территории. В результате добычи полезных ископаемых жилая и промышленная застройка отдельных населенных пунктов оказалась подработана горными работами. Проблемами подработанной территории занимаются сотрудники Пермского национального исследовательского университета в сотрудничестве с ОАО «Галугрия» (г. Пермь) [7][8][9][10]. Характер напряженно-деформированного состояния грунтового массива рассматривается в работах российских авторов [10-13] и в коллективной работе сотрудников университетов Китая [14]. За оседаниями городских территорий в Индонезии ведется наблюдение при помощи GPS технологий [15]. Ав...
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2025 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.