Семантический ТРИЗ

Дата публикации: 03.11.2010

Введение. Постулаты ТРИЗ и их отображение в программных продуктах

Теория Решения Изобретательских Задач, известная в инженерном мире по её русской аббревиатуре ТРИЗ (см., например, [1]) широко применяется для решения инженерных задач, особенно на концептуальном уровне. Ее привлекательность базируется на нескольких элегантных гипотезах. Во-первых, было замечено, что значительное число инженерных проблем может быть описанo как противоречия. Эти противоречия повторяются в различных областях, и для их решения используются одни и те же подходы. Было также обнаружено, что линии развития технических систем также повторяемы, а именно: системы развиваются в направлении повышения идеальности, гармонизации, управляемости, в сторону увеличения числа степеней свободы. И наконец общепризнанным фактом считается то, что лучшие технические решения используют физические явления различных областей знания.

Экстраполяция этих наблюдений для решения конкретных задач привела к созданию ряда инструментов ТРИЗ. Матрица противоречий пожалуй является наиболее популярным из них. Когда инженер формулирует задачу как противоречие, матрица противоречий помогает ему идентифицировать соответствующее общее противоречие, а также классический подход к его разрешению - так называемый прием изобретатения. Этот процесс основывается на простом предположении: если этот подход продемонстрировал свою эффективность в прошлом для подобной ситуации (для такого же противоречия), он может оказаться небесполезным и для конкретной ситуации. В продуктах программирования матрица противоречий применена как это показано на Рисунке 1.

Матрица противоречий в Goldfire Innovator

Рисунок 1. Матрица противоречий в Goldfire Innovator™ [2]

Рисунок 1 описывает следующую ситуацию: "Я хочу улучшить термодинамические свойства устройства, увеличивая площадь его сечения, нежелательным следствием этого улучшения является увеличение объема". Матрица противоречий позволяет перевести это противоречие в классическую форму: улучшающийся фактор - площадь движущегося объекта, ухудшающийся фактор - его объем, и предлагает несколько приемов, которые могут быть полезны в данной ситуации, поскольку они продемонстрировали свою эффективность в подобных ситуациях в прошлом.

Аналогично, весьма определенные тенденции развития технических систем были объединены в прогностическое "дерево" [2]. Существуют различные методы решения инженерных задач с его помощью [3], один из них показан на Рисунке 2.

Тенденция динамизации технических систем в Goldfire Innovator

Рисунок 2. Тенденция динамизации технических систем в Goldfire Innovator™ [2]

Рисунок 2 иллюстрирует одну из тенденций развития технических систем, тенденцию увеличивающейся динамизации: инженерные системы обычно эволюционируют в направлении увеличивающейся динамизации, а именно, они используют больше шарниров, увеличивают эластичность компонентов, замещают твердые материалы жидкостью, газом, и т.д. Хотя решения, предлагаемые этим методом, представляют собой абстрактные схемы того, что инженер в конечном счете применит на практике, их универсальность служит стимулом для генерации идей и концептуальных решений. Неявное экстраполяционное предположение этого метода аналогично экстраполяции, используемoй для приемов: другие инженерные системы демонстрируют эту тенденцию, поэтому не исключено, что система над которой мы сейчас работаем, может претерпевать такие же изменения.

Идея ТРИЗ искать новые решения в пограничных областях науки и техники обусловила создание базы данных научных эффектов [2], которая в данное время является наиболее развитой библиотекой подобного типа. Ее 9000 физических эффектов организованы в соответствии с их функциональностью. Инженеры могут осуществлять поиск в этой библиотеке, задавая функцию, которую необходимо осуществить, и получить в ответ физическое явление, которое может быть использовано для этой цели. Этот процесс иллюстрируется Pисунком 3.

Библиотека научных эффектов в Goldfire Innovator

Рисунок 3. Библиотека научных эффектов в Goldfire Innovator™ [2]

Рисунок описывает следующую ситуацию: "Мне нужно измерить температуру нижнего слоя многослойного материала". Вместо того, чтобы решать, какая область науки должна быть применена для решения этой проблемы, инженер может просто открыть "полку" библиотеки с именем, которое соответствует сформулированной выше проблеме - "как измерять температурные параметры" - и просмотреть научные эффекты, которые могут быть использованы для измерения температуры.

Три вопроса…

В науке всегда было нелегкой задачей вывести общий закон из конкретных наблюдений. Те, кто отваживаются приступить к этой задаче, должны быть способны обосновать правомочность такой экстраполяции. Для инструментов ТРИЗ вопросы, на которые следует ответить, весьма очевидны:

1. Является ли матрица противоречий статистически устойчивой? Попросту говоря, если мы продолжим анализ патентов, аналогичный тому, который проводился основателем ТРИЗ Генрихом Альтшуллером, и проанализируем все существующие патенты, изменится ли матрица противоречий? Если изменится, то как она изменится?

2. Являются ли линии развития технических систем статистически устойчивыми? Охватывают ли они все существующие тенденции развития современных технологий

3. Как перешагнуть через "пропасть" от общей рекомендации к конкретной новой идее?

Для того, чтобы ответить на эти вопросы, нам нужен некий инструмент, способный прочесть миллионы документов (например, патентов), и который достаточно "умный", чтобы их "понять". Средства, обладающие подобными свойствами, основаны на семантичеcкой технологии. Ее применение к решению технических задач означает начало нового направления в инновационном процессе, которое постепенно может стать новой инженерной дисциплиной, которую я называю Семантический ТРИЗ.

Основы семантической технологии

Семантические технологии основаны на математической лингвистике. Лингвистический анализ текста [4] в настоящее время ведется на четырех основных уровнях, которые можно определить как распознавание слов и предложений, лексический анализ, синтаксический анализ и семантический анализ. Миссия первого уровня очевидна. Лексический анализ включает в себя чтение предложений, расчленение их на индивидуальные слова и определение их частей речи путем сравнения с базами данных (словарями). Лексический анализ усилен моделью, основанной на Марковских цепях, которая вычисляет вероятность распределения последовательностей частей речи и определяет наиболее вероятную последовательность частей речи в предложении. Синтаксический анализ использует фразовую структурную грамматику, определяет синтаксическую структуру текста и окончательно определяет часть речи для каждого слова. Семантический анализ выделяет значение текста, извлекая из предложения его семантические единицы, такие как субъект, действие и объект.

Применяя этот анализ к следующему предложению
"Электролитическая диссоциация может быть использована для измерения влажности воздуха"
компьютер определит, что в этом предложении
Субъект - электролитическая диссоциация;
Действие - измеряет;
Объект - влажность воздуха.

Эти семантические единицы чрезвычайно важны, поскольку они содержат информацию о том, какой вопрос может быть задан, и каким может быть ответ. Например, если кто-нибудь задает вопрос: "Как измерить влажность воздуха?", - тот, кто задает этот вопрос, фактически определяет, что в правильном ответе Действие должно быть "измеряет", и Объект должен быть "влажность". Неизвестным для спрашивающего остается Субъект (чем измеряется влажность?). Если мы произвели семантический анализ всех доступных документов, включая тот который содержит упомянутое предложение, что означает, что мы извлекли все Субъект - Действие - Объект комбинации, тогда в ответ на этот вопрос мы дадим только те комбинации Субъект - Действие - Объект, у которых Действие - Объект такие как в вопросе, и тогда Субъект (электролитическая диссоциация) будет являться точным ответом на вопрос.

Этот простой пример фактически определяет архитектуру семантических индексирующих технологий, которые поддерживают Семантический ТРИЗ:

1. Они должны быть способны извлекать семантические единицы из вопроса

2. Они должны включать базы данных семантических единиц, извлеченных из всего многообразия доступных документов. Создание таких баз данных называется семантическим процессом который весьма похож на процесс обучения человека: мы "просим" компьютер прочесть документ, понять его содержание, извлекая семантические единицы, и запомнить их.

3. Сравнивая семантические единицы вопроса с семантическими единицами базы данных, мы получаем точный ответ на наш вопрос.

Эта архитектура была осуществлена на платформе Goldfire Innovator™ [2], где база данных была сформирована из семантических единиц всей мировой коллекции патентов. В последующих главах я продемонстрирую, что эта платформа способна эффективно поддерживать изобретательский процесс.

База данных семантических индексов как портал ответов на вопросы

Наиболее естественное применение Goldfire Innovator™ заключается в задании прямых вопросов. Рисунок 4 иллюстрирует этот процесс.

Goldfire Innovator™ в роли информационного портала "Эффекты по требованию"

Рисунок 4. Goldfire Innovator™ в роли информационного портала "Эффекты по требованию"

Если, например, задан вопрос: "How can I measure temperature of the substrate?" (Как я могу измерить температуру субстрата?), система анализирует вопрос, определяет какие семантические единицы он содержит (Действие - измерить, Объект - температура субстрата) и сравнивает их с несколькими миллиардами семантических единиц, извлеченных из всей мировой коллекции патентов. Результаты этого сравнения представляют собой точный ответ на заданный вопрос и представленны на Рисунке 4. В то время как результаты, показанные на Рисунке 3, демонстрируют какие физические явления могут быть использованы для измерения температуры вообще, ответы, представленные на Рисунке 4, очень конкретны и говорят о том, как именно температура субстрата может быть измерена. Поэтому это применение семантического анализа я называю "Кастомизированные Эффекты" или "Эффекты по требованию".

База данных семантических индексов как матрица противоречий

Проблема статистической устойчивости матрицы противоречий волновала многих исследователей (см., например, обзор в [5]). Поскольку вопросы к Goldfire Innovator™ могут задаваться в том числе и в форме противоречия, можно утверждать, что, для всеx практических нужд, эта проблема сохраняет свою актуальность разве что с исторической точки зрения. На Рисунке 1 мы проиллюстрировали ситуацию, как матрица противоречий Альтшуллера обыгрывает следующую ситуацию: "Я хочу улучшить термодинамические свойства устройства, увеличивая площадь его сечения; нежелательным следствием этого улучшения является увеличение объема". Сейчас, мы можем сформулировать это противоречие как естественный вопрос: " Как я могу увеличить площадь сечения, но при этом уменьшить объем?" ("How can I increase area, but decrease volume?") и адресовать этот вопрос всей мировой коллекции патентов.

Goldfire Innovator™ как матрица противоречий

Рисунок 5. Goldfire Innovator™ как матрица противоречий

Ответы на этот "противоречивый" вопрос показаны на Рисунке 5. Они дают весьма подробную информацию, как именно это противоречие разрешалось в прошлом.

Исследование эволюционных процессов с помощью базы данных семантических индексов

Goldfire Innovator™ позволяет исследовать эволюционные процессы для любой отрасли, технологии, прибора, материала, или, если говорить в общем, он позволяет построить временную зависимость ответов на вопросы. Этот процесс показан на Рисунке 6. Он показывает, что вопрос "Как мы можем обнаружить утечку газа?" ("How can we detect a gas leak?") может быть задан в определенном временном интервале. Если мы будем задавать этот вопрос периодически, мы увидим, как ответы изменяются во времени. Временная зависимость ответов на вопросы есть ни что иное как тенденция развития специфической технологии. Результаты ответа на вопрос "Как мы можем обнаружить утечку газа?" ("How can we detect a gas leak?"), заданного в пятилетнем интервале, показаны на Рисунке 7.

Как можно задавать вопрос в определенном временном интервале

Рисунок 6. Как можно задавать вопрос в определенном временном интервале

Результаты ответа на вопрос "Как мы можем обнаружить утечку газа?"

Рисунoк 7. Результаты ответа на вопрос "Как мы можем обнаружить утечку газа?"

Результаты ответа на вопрос "Как мы можем обнаружить утечку газа?" ("How can we detect a gas leak?"), заданного в пятилетнем интервале.

Как это очевидно из Рисунка 7, средства обнаружения утечек газа эволюционировали от акустических, термических и механических решений до оптических, аудиовизуальных и спектрографических методов.

В ТРИЗ широко распространено мнение, что оценка развития системы ("детство" - бурное развитие - стагнация) может быть произведена, когда временная зависимость числа патентов сравнивается с их уровнем. В то время как временная зависимость числа патентов может быть легко построена, задача автоматического определения их уровня является весьма непростой. Пять уровней изобретения, предложенные Альтшуллером, логичны, но не содержат точного критерия и поэтому сложны для численных алгоритмов. В методах конкурентного анализа (см., например, [6,7]), цитирование патентов широко используется для оценки интеллектуальной собственности. Мы предлагаем использовать цитирование в качестве индикатора (разумеется лишь одного из многих возможных) для оценки уровня изобретения, предполагая, что выдающиеся решения будут интенсивно цитироваться последователями.

Мы использовали следующую статистическую модель. Допустим мы анализируем последовательность связанных (одна и та же технология) патентов , где индекс i увеличивается во времени. Тогда вероятность того, что единичная ссылка в ссылается на может быть оценена как.

Bероятность того, что единичная ссылка в не ссылается на может быть оценена как

Вероятность того, что патент не упомянут хотя бы один раз патентом если он имеет m ссылок, может быть оценена как

Число патентов K, которые все вместе ссылаются на хотя бы один раз может быть оценена из уравнения (4):

Тогда число ссылок, которые было бы естественно ожидать для патента , может быть оценено как

Мы будем называть патент "выдающимся", если число ссылок, которые он получил в действительности, превосходит C.

В качестве примера на Рисунке 8 мы показываем результаты анализа, выполненного с помощью Goldfire Innovator™ для 344 патентов, описывающих оптиковолоконные гироскопы. Интересно, что число патентов изменяется во времени в полном соответствии с классическим циклом, ясно демонстрируя стадии "детство" - бурное развитие - стагнация. Как и следовало ожидать (у новых патентов меньше шансов быть цитируемыми), число естественно ожидаемых ссылок уменьшается во времени. Результаты также показывают, что вопреки традиционным взглядам, "выдающиеся" патенты не обязательно сосредоточены в начале цикла. Этот результат, тем не менее, должен рассматриваться как предварительный, поскольку корреляция критерия (5) с уровнем изобретения, разумеется, не прямая.

Pезультаты анализа, выполненного с помощью Goldfire Innovator

Рисунoк 8. Pезультаты анализа, выполненного с помощью Goldfire Innovator™ для 344 патентов, описывающих оптиковолоконные гироскопы. Вертикальные оси грaфиков (сверху вниз): число патентов, ожидаемое количество ссылок, доля "выдающихся" патентов.

Заключение

Полвека тому назад, когда ТРИЗ только начинал разрабатываться, возможность автоматически анализировать миллионы документов была совершенно немыслимой. Поэтому традиционный ТРИЗ развивался по пути многих эмпирических методов: от интенсивных (хотя и ограниченных) наблюдений к экстраполяции и обобщению.

Развитие математической лингвистики позволило нам объединить классический ТРИЗ с семантическими технологиями. Я назвал этот метод Семантический ТРИЗ. По определению, поскольку каждый вопрос адресуется всей мировой коллекции патентов, Семантический ТРИЗ абсолютно конкретен и может обогатить многие традиционные подходы ТРИЗ:

1. Когда вопросы задаются напрямую, Семантический ТРИЗ работает как кастомизированная библиотека эффектов;

2. Когда вопросы задаются в форме противоречия, Семантический ТРИЗ работает как огромная (в данный момент 107x107) матрица противоречий, показывая как конкретно противоречие было разрешено;

3. Если вопросы задаются во временном интервале, Семантический ТРИЗ генерирует конкретные тенденции развития.

Я благодарен Джиму Тодхантеру за полезные дискуссии.

Литература

1. Genrich Altshuller. The Innovation Algorithm: TRIZ, Systematic Innovation and Technical Creativity. 1999. Technical Innovation Center, 312 pp

2. Ena Arel. Goldfire Innovator™. Volume I: Optimizer User Guide. Volume II: Patents and Innovation Trend Analysis User Guide. 2004. Invention Machine Corporation, Boston, MA, 725 + 263 pp.

3. Ena Arel, Mikhail Verbitsky, Igor Devoino, Sergei Ikovenko. TechOptimizer Fundamentals, 2002, Invention Machine Corporation, Boston, MA, 134 pp.

4. Precision in Knowledge Retrieval. 2002. Invention Machine Corporation, Boston, MA, 5 pp. (http://www.invention-machine.com/sitemap.cfm - white paper)

5. Ellen Domb and Michael Slocum. "Introducing Matrix 2003 - New research and a new format for the popular TRIZ tool", TRIZ Journal, 2003, v.8

6. Mogee, M.E., "Patent analysis for strategic advantage: Using International Patent Records," Competitive Intelligence Review, v. 5 (Spring 1994): 27-35.

7. Mogee, M.E., "Patents and technology intelligence," in Technical Intelligence for Business: Keeping Abreast of Science & Technology, ed. by W.B. Ashton and R.A. Klavans, Washington, D.C.: Battelle Press, 1997.

(Голосов: 0, Рейтинг: 0)

Добавить комментарий:

Комментарии:

Статьиcегодня статей - 280