Форматы данных: кто виноват и как с этим бороться?
Некоторое время назад один из российских блоггеров задал такой вопрос - какое будущее ждет САПР-форматы? Ответив в формате блога, то есть достаточно лаконично, я посчитал, что такая животрепещущая тема заслуживает более пространного рассмотрения и отдельной развернутой публикации. Чтобы получить информацию в концентрированном виде, я обратился к материалам специализированного форума Collaboration & Interoperability congress (CIC-2010), проводящийся ежегодно с 2007 года. Эти материалы отражают картину на момент весны 2010 года, т.к. форум проводится традиционно в конце мая.
Следует оговориться, что эти опросы не являются исследованием собственно рынка САПР, а лишь отражают тенденции и мнения наиболее активных пользователей в области коллективной работы и обмена данных.
Итак, какова общая картина в области форматов данных сегодня, и как она изменилась за последние годы?
По результатам ежегодных исследовательских опросов, проводимых одним из организаторов и активных участников CIC, аналитическим агентством Longview Advisers, в 2007 году в активном использовании было 44 различных формата данных САПР. На май 2010 это число составляло уже 52 различных формата. Причина тому очевидная – появились новые продукты со своими оригинальными форматами, такие как SpaceClaim, 3D VIA Composer, поле приобретения Google приобрел значительную популярность SketchUp и т.д.
Тем не менее, наибольшая доля используемых форматов приходится на лидеров рынка- CATIA V5, SolidWorks, AutoCAD и NX. На диаграмме приведены частота использования того или иного продукта в качестве основного, вспомогательного и, в ряде случаев второго вспомогательного.
Что касается форматов, используемых для обмена данными, абсолютное лидерство принадлежит нейтральному STEP, он используется в этих целях 32% опрашиваемых. Это на 13% больше, чем было в 2008 году. Использование формата CATIA V5 примерно соответствует доле респондентов, использующих CATIA в качестве основной САПР. Таким образом, эти два формата используются более чем в 50% случаев обмена данными.
Общее распределение частоты использования форматов первого эшелона для обмена данными:
Распределение вспомогательных форматов для обмена, или форматов второго эшелона:
Респондентов также спросили, какие из форматов они вообще не используют для обмена данными, в число таких попали SolidEdge, I-DEAS, 3DXML, U3D и XVL, что существенно отличается от положения дел в 2008 году.
Переход на более новую версию ПО – процесс регулярный, в большинстве случаев по ответам респондентов не вызывающий сложности в части совместимости форматов даны, однако есть и неутешительные исключения. Примером может служить переход от CATIA V4 к V5, 15% респондентов отметили, что они вынуждены задействовать заметные ресурсы на такой переход. Дело еще осложняется и тем, что Dassault Systemes, по словам участников опроса, недостаточно уделяет внимание полноценной поддержке стандарта STEP.
Более сложным вариантом развития событий является переход на CAD-систему от другого поставщика, использующую другой формат данных. Сложности такого перехода отметили 23% участников опроса.
На вопрос, как часто при создании новых проектов используются данные, унаследованные в уже выполненных проектах, 30% респондентов сообщили, что они так поступают в 50-70% случаев, некоторые компании всегда используют ранее наработанные данные.
Тем не менее, если сравнивать с ситуацией 2008 года, переиспользование данных стало менее частой практикой. В качестве главной причины этого респонденты называют недостаточную совместимость форматов. Среди тех, кто использует ранее наработанные данные 8% отметили, что они никогда не получают данные в нужном им формате. Только 14% сообщили, что получают данные в требуемом формате, и только 8% получают данные в нужном формате в 90-99% случаев, тот показатель вдвое ниже, чем в 2008 году. 23% респондентов работают с правильным форматом в 75-89% случаев, что соответствует уровню 2008.
Таким образом, несмотря на развитие инструментов и услуг для трансляции данных, особого прогресса в этой области пока не наблюдается.
Примерно половина участников опроса сообщили, что для обмена данными они используют только 3D и никогда 2D. В качестве объяснения приводятся несколько аргументов, основные из них:
Даже при обмене данными внутри компании почти в 30% случаев данные передаются не в том формате, который требуется. Только 15% респондентов сообщили, что получают ошибочные данные от своих коллег реже, чем в 25% случаев. Это серьезный аргумент для того, чтобы компаниям задуматься над улучшением внутренней политики и инфраструктуры обмена данными.
Ситуация становится еще более драматичной, когда заходит речь об обмене данными между компаниями-смежниками. Лишь 8.6% сообщают, что получают от партнеров корректные данные в нужном формате. Примерно 52% респондентов могут лишь надеяться, что получат извне корректные данные с вероятностью между 50-90%.
Исследование показывает, что нарастает доля предпочитающих использовать специализированные системы трансляции данных перед использованием встроенной функциональности импорта/экспорта. В 2008 году эта доля составляла 30%, в то время как в 2010 году она поднялась до 66%. В большинстве случаев используются инструменты от известных поставщиков, таких как ITI TranscenData, Theorem Solutions, Spatial и TransMagic. Некоторые респонденты назвали решения Kubotek, 3D PDF и Right Hemi-sphere.
10% опрошенных добиваются 100% корректного результата от использования систем трансляции данных, с другой стороны примерно столько же никогда не получают удовлетворяющего их результата.
Наиболее часто встречающейся ошибкой при передаче данных в 38% случаев является то, что данные, имевшиеся в исходном файле, отсутствуют в доставленном. Второй по частоте (25%) проблемой названы ошибки в геометрии: пропавшие или перевернутые грани, дублированные ребра и т.д. На третьем месте – ошибки с файлами (не тот формат, не та версия и т.п.).
Заметно снизилась доля т.н. «ошибки посылающего», т.е. передача не того файла. С 2008 года доля таких ошибок снизилась с 33% в 2007 году до 9% в 2010. Такой прогресс достигнут благодаря более широкому использованию специализированных систем управления обменом данных, таких, например, как TranscenData‘s DEXCenter.
Тем не менее затраты времени на исправление и коррекцию данных остаются неоправданно высоки. 18% дизайнеров и инженеров тратят от 8 до 24 часов в рабочую неделю на исправление ошибочных или воссоздание утраченных данных. Примерно 50% из них – высококлассные, хорошо оплачиваемые профессионалы, тратящие более одного рабочего дня на эти бессмысленные усилия.
Подходы к обмену данными у OEM(производители комплектных изделий) и поставщиков комплектующих существенно отличаются.
Во-первых, поставщики комплектующих гораздо больше предпочитают обмениваться данными о конструктивных элементах, истории построения, производственной информацией, чем OEM, которые в 80% случаев ограничиваются обменом только геометрией и топологией. С другой стороны OEM в большинстве случаев не допускают редактирования данных на стороне поставщиков комплектующих. В то время как OEM предпочитают обмениваться данными в нативных форматах и даже требовать от поставщиков использования той же CAD-системы, поставщики комплектующих все чаще предпочитают использовать нейтральный STEP, в 2008 году таких было 10%, в 2010 уже 33%.
Одной из сложностей, с которой сталкиваются разработчики функции импорта, экспорта или трансляции данных, является либо отсутствие, либо неполное описание формата данных.
Когда на различных конференциях или в интервью топ-менеджеров мира САПР спрашивают, почему их компания не предоставляет документации на используемы форматы файлов, можно услышать довольно широкий спектр ответов. Мой американский коллега Эван Ярес (участники первого форума isicad-2004 должны его хорошо помнить) собрал целую коллекцию таких высказываний, некоторые из них просто обескураживающие:
Есть еще несколько причин, названных людьми, не относящимися к топ-менеджерам САПР, видимо эти причины пришли авторам в голову от полного незнания предмета:
Что примечательно – ответы из первой группы бессмысленны, если посмотреть с точки зрения интересов пользователей. Ответы же из второй группы совершенно бессмысленны с юридической точки зрения, особенно последний, который лишь скрывает реальную причину – «это то, о чем мы не хотим никому рассказывать». На деле, любая патентуемая сущность уже должна быть задокументирована, иначе нечего патентовать, кроме того, форматы данных не являются объектом авторского права ни в одной юридической системе.
И есть причина, которую никогда не назвал ни один топ-менеджер САПР:
Вот, собственно, и все обоснование и это действительно резонно. Но если хоть кто-то из топ-менеджеров САПР ее назовет – это вызовет неминуемое недовольство клиентов. Если у вас есть какие-то другие мнения о причинах не документирования форматов данных – было бы интересно их услышать.
Как видно из всего изложенного выше – вряд ли можно ожидать сотрудничества конкурирующих разработчиков САПР в области обмена информацией об устройстве их форматов данных, и, тем более, в разработке такой функциональности. Остается уповать на независимые стандарты и форматы. Из них наиболее перспективным и востребованным можно назвать набор стандартов STEP (ISO 10303). STEP с очевидностью вытесняет IGES благодаря более широким возможностям хранения информации, самая свежая версия IGES датируется теперь уже далеким 1996 годом, в то время ревизия STEP происходит каждые два года. Как уже было сказано, 3DXML также не приобрел популярности у пользователей.
В настоящее время наибольшее распространение в обмене данными получили стандарты STEP AP203 (авиационный) и AP214 (автомобильный). Наиболее современным является AP203 second edition, опубликованный ISO в 2009 году. В новую редакцию вошли такие возможности:
В последнее время появилась тенденция сходимости AP203 и AP214, которая должна привести к появлению нового единого стандарта AP242, комбинирующего преимущества 203 в описании геометрии и богатые возможности 214 в описании производственных процессов. Кроме того в AP242 появятся следующие новые сущности:
Итак, STEP на сегодня: