对于任何一家创新型企业而言,创新科技和知识产权均是企业发展过程中打造护城河的关键,随着各领域的不断深入探索,因新技术专利而产生的纠纷也日益增多,企业对于创新知识产权服务以及规避潜在专利诉讼风险的需求也在迅速增长。
据相关信息显示,2018 年以来,人民法院年均审结各类知识产权案件 44 万件,年均增长 21%,且近年来我国不断加大知识产权司法保护力度,这一数据在未来仍可能将处于增长状态。
基于此,科技创新情报 SaaS 服务商智慧芽(PatSnap)从全球专利数据信息为切入点进行产品和服务平台的搭建,在服务科技创新和知识产权的广度、纵深度上持续投入研发,融合大数据和人工智能技术,搭建了包括 PatSnap 全球专利数据库、Innosnap 知识产权管理系统、Insights 英策专利分析系统、Discovery 创新情报系统、Life Science 系列数据库等的产品矩阵,为创新企业、科研院所、金融公司等机构提供科技创新情报和知识产权信息化服务。
目前,智慧芽的服务已逐步覆盖了生物医药、化学、汽车、新能源、通信、电子等 50 多个高科技行业,服务全球客户超一万家。就在今年 3 月,智慧芽宣布完成了 3 亿美元的 E 轮融资,由腾讯和软银愿景基金二期领投,CPE 跟投,红杉中国、顺为资本和祥峰投资等老股东继续加持,这也是 2020 年以来国内 SaaS 细分赛道最大的一笔融资。
深耕高价值细分领域,
打造生物医药情报平台
经过十余年的发展,智慧芽早已基于强大的数据资源搭建了成熟的全球专利、文献等数据系统,形成了行业领先的专利的检索数据库。针对生物医药、科技等研发投入极高的行业,智慧芽也在不断布局和完善相应服务。
随着世界各国经济的发展以及人民生活水平的提高,全球医疗支出不断增加,制药工业的发展得到了极大的提升,生物医药行业市场规模日益扩大,同时各药企在新药研发方面也不断加大力度。现如今,药物发现阶段和临床前研究阶段是各药企亟待攻关的两大难点,生物新药研发也面临着研发周期长、研发成功率低以及研发费用高等困境。
据相关信息显示,2018 年研发药物的成本是 22 亿美元,而 2010 年这个数字是 10 亿美元,但生物医药研发的回报率却从 2010 年的 10.1% 降低到了 2018 年的 1.9%。在整个新药研发过程中,前期对于疾病选择、靶点发现等信息的收集显然是极为重要的一环,也能在很大程度上减少研发中资源和机会的浪费。然而在信息爆炸的时代,海量的信源使得信息的精准挖掘困难重重。
以专利数量为例,全球含序列的专利是 106.9 万余件,并以 4.8 万件 / 年的公开数量高速增长,而传统的生物医药数据库则可能存在免费数据库信息不全,内容分散,付费的专业数据库对检索技能要求高,且价格昂贵的问题,从而导致难以适配药物创新。
早在 2015 年,智慧芽就开始加大了生物医药产品线的投入,陆续推出了重点服务于化学领域企业的化学结构检索数据库(Chemcial)、服务于生物领域企业的序列检索数据库(Bio),并将于今年推广用于生物医药情报领域的医药情报数据(Synapse),最终构建一个国际化的专注于生物医药的公共服务平台。
由于生物医药行业自身的特殊性,所涉及数据对象范围极其广泛,除小分子、大分子外,还包括靶点、药物、疾病、通路、标志物等实体数据,其间涉及大量的数据标准化、分类、对齐、标注等处理工作。除此之外,还需要考虑其相应的公开物以及涉及的专利、文献、临床试验、药物批复、新闻、投融资信息等。这也意味着平台的搭建对人才的综合能力要求极高,需要覆盖复杂的知识结构,包括知识产权、科技情报、大数据处理、人工智能等。
为保障平台的顺利搭建,智慧芽在布局生物医药领域的同时,汇聚了超百人专业人才,其中大多数来自国内外领先的生物医药、人工智能、知识产权领域头部企业,硕士、博士占比更是高达 50%。
利用该平台,国内企业、科研院所、投资机构、咨询机构可以基于化学结构和生物序列,获取最全面的专利和论文公开状态,基于靶点、疾病、药物等生物实体,获取最及时的新药研发过程中的情报,提高了获取知识的准确性、便捷性和及时性,有助于加速以初创企业为主的国内生物医药产业的发展,提高创新力。
服务基于核心底层数据,
已惠及超 1000 家生物医药企业
智慧芽能够成功在生物医药领域不断推出产品和服务,显然离不开团队一直以来的积累。因各国知识产权数据文种不同、线上化程度不同,常要拓荒式追根溯源,并经历翻译、清洗、挖掘、标注、智能分析等一系列整理工作。经过长达 14 年的沉淀,智慧芽已打造出稳居行业前列的知识产权数据库,成为其所有业务的坚实底盘。
目前在生物医药领域,智慧芽已形成了 1.7 亿个小分子结构、6.1 亿个生物序列的庞大数据库。同时,拥有覆盖 116 个国家的 1.5 亿专利、1.4 亿文献、427 万公司、1600 万新闻、13 万临床试验等数据。2020 年 3 月,智慧芽与 CAS 签署了长期战略合作协议,获得其积累一百余年的全球最优质的小分子基础数据。
数据信息处理方面,基于图像处理能力、自然语言处理、光学字符识别(OCR)和机器翻译等技术,智慧芽已形成了强大的 " 数据加工厂 " 模式,同时搭建有数据标准工程和数据特征工程一体化体系,保障了数据处理的全面性,实现了数据标注智能化,大大提高了数据处理效率。
在生物医药领域,智慧芽还创新运用了深度学习模型、生物实体自然语言处理技术、针对小分子和大分子的检索算法等先进技术,用于在专利、论文等科技文档中提取小分子和大分子数据,并标注相应关系数据;建立了与靶点、药物等生物实体的标准关系数据,匹配以小分子化学结构和大分子生物序列的特殊检索算法,解决了生物医药领域信息获取的准确性、全面性和高效率难题。
从结构上来看,目前智慧芽生物医药情报平台包含有 Bio、Chemical、Synapse 三大数据库,其侧重点各有不同,但总体而言均是以检索、图标、知识图谱等常见交互方式来降低用户获取知识的难度。
据了解,智慧芽生物医药情报平台在全球范围内已经服务生物医药企业超过 1000 家,仅在国内就有近 300 家企业使用了智慧芽相关产品,其中不乏恒瑞医药、信达生物、博瑞生物、派格生物、药明康德、华大等业内领先企业。
以行业积累不断打造技术优势
此外,结合生物医药行业情况,智慧芽还会将其余已成熟的产品和服务复制到生物医药领域。以智慧芽的科创评价体系为例,通过强大的数据库和产品能力,智慧芽的科创评价体系可为企业级客户提供科技画像评估和科技成果评估,在汽车、工业制造、通讯电子、金融、政府园区服务等科创评估场景应用领域广泛。
由于生物医药领域的科创评估有其行业的特殊性,基于智慧芽领先的数据优势和科创评估体系的丰富经验,智慧芽也将不断优化和完善在生物医药领域科创评估体系的指标模型,加快覆盖生物医药领域的应用。
未来,智慧芽将继续在生物医药领域深化产品布局,保持以知识产权数据为核心,不断覆盖与研发创新相关的知识能力,为更多国内外客户提供行业标杆性的生物医药领域数据和研发创新服务,助推行业发展。