
Штучний інтелект настає. Про це ми чули весь 2018 рік і, мабуть, почуємо і в цьому. Відомі компанії, якщо тільки це не Google або Facebook, не можуть не ставити питання: “Що допоможе нам вижити в нових умовах”?
З нашого досвіду, коли бізнес-лідери ставлять це питання про ШІ, відповіддю стає слово “дані”. Ця думка підтверджується діловою пресою. Сотні статей стверджують, що “дані – це нова нафта”, маючи на увазі, що дані стають пальним, що забезпечує зростання економіки штучного інтелекту.
Якщо це ваш випадок, то вашій компанії пощастило. Ви зібрали ці дані, і тепер, виявляється, сидите на запасах нафти в очікуванні ШІ. А поки добре б запитати себе: чи “Дійсно нам так пощастило”?
У словах «дані – це нафта» є доля правди. Аналогічно тому, як двигуни внутрішнього згоряння потребують палива, штучний інтелект потребує даних. ШІ бере необроблені дані і перетворює їх в щось корисне для прийняття рішень. Хочете дізнатися погоду на завтра? Використовуйте минулі дані про погоду. Хочете дізнатися, як будуть продаватися йогурти на наступному тижні? Використовуйте дані про минулі продажах. Штучний інтелект будує прогнози на основі даних.
Але чи потрібні штучному інтелекту саме ваші дані? На сьогодні існує тенденція розглядати всі дані як потенційно цінні для штучного інтелекту, але це не зовсім так. Так, дані аналогічно паливу використовуються для побудови прогнозів. Але дані, на яких ви сидите, швидше за все, не ті. Дані, якими ви володієте і які ваша компанія накопичила з часом, відносяться до типу, використовуваного для створення механізмів прогнозування, але не для їх експлуатації.
Наявні у вас дані – це навчальні дані. Вони використовуються для навчання алгоритму. І ви користуєтеся цим алгоритмом для отримання прогнозів, які впливають на ваші дії.
У цьому сенсі ваші дані представляють цінність. Але це не означає, що ваш бізнес переживе шторм. Варто вам використовувати дані для навчання механізму прогнозування, як вони знецінюються. Вони більше не придатні для подібних прогнозів. Кількість прогнозів, для яких можна використовувати дані, обмежена. Якщо продовжити аналогію з нафтою, дані горять. Після використання вони перетворюються в пустушку. Вченим це відомо. Вони витрачають роки на збір даних, але після того, як їх використовували для отримання результатів дослідження, ці дані припадають пилом в ящику або зберігаються на резервному диску. Можливо, ваш бізнес і сидить на нафтовій свердловині, але її не можна вважати нескінченною. Вона гарантує ваше майбутнє в економіці штучного інтелекту менше, ніж ліквідаційна вартість.
Навіть якщо ваші дані представляють цінність, у вас може бути обмежена можливість опанувати цю цінністю. Скільки ще існує порівнянних джерел даних? Якщо ви один з безлічі продавців йогуртів, то ваша база даних, що містить інформацію за останні 10 років по продажах і пов’язаних даних (ціна, температура, продаж аналогічних продуктів на зразок морозива) матиме меншу цінність, ніж якби ви були єдиним власником подібних даних. Інакше кажучи, як і у випадку з нафтою, чим більше інших постачальників даних того ж типу, тим меншу цінність ви можете з них витягти. Крім того, на цінність ваших навчальних даних впливає цінність, що отримується за допомогою підвищеної точності прогнозів. Цінність навчальних даних вища, якщо підвищена точність прогнозу може збільшити продажі йогуртів на $100 млн, а не на $10 млн.
Крім того, джерелом постійної цінності є повсякденні дії, тобто дані, що накопичуються щодня. Нові дані дозволяють вам експлуатувати механізм прогнозування після його навчання. Вони також дають можливість покращувати його шляхом навчання. Дані про продажі йогурту за 10 років цінні для навчання моделі ШІ прогнозувати майбутні продажу, однак актуальні прогнози, які використовуються для управління ланцюжком поставок, вимагають безперервних операційних даних. І це важливий момент для компаній, які давно працюють на ринку.
Стартап, що користується штучним інтелектом і який отримує цінні дані про минулі продажі йогуртів, може навчити модель ШІ прогнозувати майбутні продажі. Але він не може використовувати її для прийняття рішень, якщо не буде постійно отримувати операційні дані для навчання. На відміну від стартапів великі підприємства генерують операційні дані щодня. І в цьому їх перевага. Чим більше операцій, тим більше даних. Крім того, власник компанії може користуватися прогнозом для поліпшення майбутніх операцій.
В умовах економіки штучного інтелекту цінність накопичених вами даних обмежена разовою перевагою навчання використовуваного вами ШІ. На цінність навчальних даних, як і на цінність нафти або іншої сировини, впливає загальний обсяг пропозиції: чим більше компаній розпоряджаються ними, тим нижча цінність. На відміну від них цінність регулярно одержуваних операційних даних необмежена одноразовим застосуванням, а забезпечує постійну перевагу і покращує механізм прогнозування. Тобто незважаючи на всі розмови про те, що дані – це нова нафту, суть не в накопичених історичних даних. Хоча завдяки їм ви можете дістатися до суті, їх цінність для майбутнього вашого бізнесу невелика. Але якщо ви зможете знайти способи генерувати безперервний потік нових даних, ви зможете забезпечити поліпшення здатності прогнозування ШІ. І будете мати стійку перевагу, коли ера штучного інтелекту настане.
Автори: Аджай Агравал, Джошуа Ганс, Аві Голдфарб
Джерело: Harvard Business Review