O NotebookLM da Google Tem como Objetivo Ser o Assistente de Escrita Definitivo

O NotebookLM do Google o seu Assistente de Escrita Definitivo

Steven Johnson escreveu 13 livros, abordando temas que vão desde um surto de cólera em Londres até o valor dos videogames. Ele foi apresentador de televisão e apresentador de um podcast. Ele é um palestrante principal que não precisa se autodenominar assim em seu perfil do LinkedIn. E há mais de um ano, ele é um funcionário em tempo integral do Google, um status que fica claro quando ele me dá acesso aos escritórios do gigante das buscas em Chelsea, Nova York, para me mostrar o que sua equipe está criando.

Texto simples

CADASTRE-SE para receber o Texto simples

Se chama NotebookLM e a maneira mais fácil de pensar nele é como um colaborador de inteligência artificial com acesso a todos os seus materiais, que está ao seu lado metaforicamente para orientá-lo em seu projeto. O NotebookLM foi lançado em versão beta para um grupo seleto no início deste ano, mas agora está disponível para todos como um “experimento” – essa é a maneira de baixo risco do Google ver como o aplicativo se comporta e como nos comportamos com o aplicativo.

Johnson encontrou seu caminho para o Google através de uma obsessão de longa vida com software como um “parceiro de pensamento dinâmico”, uma ferramenta para acelerar e melhorar o processo criativo. Quando estava na faculdade, ele ficou obcecado pelo HyperCard, o software da Apple que dividia o conhecimento em pedaços e permitia que você navegasse por um espaço de informações por meio de links. Ele antecipou a navegação na web antes que a web existisse. “Eu lutei muito para transformar o HyperCard naquela ferramenta dos meus sonhos, mas ainda não estava pronto”, diz ele. Ele acabou se tornando um entusiasta do Scrivener, um processador de texto combinado com um organizador de projeto popular entre autores de livros. (Eu também sou fã.)

Quando Johnson teve acesso ao gerador de texto GPT-3 da OpenAI em 2021, ele reconheceu que a IA poderia levar a uma nova geração de ferramentas de pensamento. Ah, espera, ele disse para si mesmo, essa coisa que sempre esteve em segundo plano na minha mente agora vai ser possível. Cenários impensáveis até um ano atrás subitamente foram considerados. Johnson ainda não sabia que o Google não apenas tinha modelos de linguagem grandes semelhantes, mas também já estava trabalhando em um projeto muito alinhado com seu pensamento. Em maio de 2022, uma pequena equipe na divisão experimental Google Labs enviou um e-mail frio para Johnson. Eles marcaram uma reunião via Starline, um projeto do Google Labs que permite reuniões presenciais surpreendentemente íntimas. “Basicamente, tive uma conversa com um holograma que disse: ‘Sabe, essa coisa que você vem perseguindo a vida toda? Finalmente podemos construí-la'”, diz Johnson. Ele se tornou um consultor em tempo parcial para a pequena equipe, compartilhando inicialmente o fluxo de trabalho de um escritor profissional. “Aqui estão quatro ou cinco engenheiros, aqui está um autor real, vamos apenas observá-lo”, resume Josh Woodward, chefe do Google Labs. Eventualmente, Johnson se envolveu no desenvolvimento do próprio produto e se envolveu a ponto de aceitar um emprego em tempo integral. Seu título no Google Labs é diretor editorial.

O NotebookLM, originalmente chamado de Projeto Tailwind, começa criando um conjunto de dados com base em seu material de origem, que você arrasta para a ferramenta a partir do Google Docs ou da área de transferência. Depois que o aplicativo processa todas as informações, você pode fazer perguntas ao NotebookLM sobre o seu material, graças à tecnologia de modelos de linguagem avançados do Google – parte dela alimentada pelo Gemini, o mais recente upgrade do Google. As respostas refletem não apenas o que está em seu material de origem, mas também o entendimento geral do mundo que o Gemini tem. Um recurso crítico é que cada resposta a suas perguntas vem com um conjunto de citações que informam de onde exatamente a informação veio, para que os usuários possam verificar a precisão das respostas.

O Google não é a única empresa que está projetando produtos que permitam às pessoas criar conjuntos de dados personalizados para explorar com os LLMs. No OpenAI Developer Day do mês passado, a empresa apresentou os mini-GPTs personalizados que podem ser ajustados para uma tarefa específica. Woodward reconhece uma “similaridade central”. No entanto, ele argumenta que o NotebookLM foca mais em aprimorar um fluxo de trabalho e tem como objetivo fornecer uma precisão superior em suas saídas. Além disso, ele diz que os produtos da OpenAI têm mais personalidade, enquanto o NotebookLM foi projetado para não ter pretensões desse tipo.

Eu tenho brincado com o NotebookLM há algumas semanas. A parte mais irritante do processo de escrita para mim tem sido constantemente ter que sair do meu manuscrito para encontrar a informação exata que preciso em uma transcrição ou documento ao qual quero me referir ou citar. Ao escrever este ensaio, quando queria me lembrar do cargo oficial de Johnson, o NotebookLM forneceu instantaneamente a resposta quando solicitei. Mas essa é apenas uma de suas utilizações mais prosaicas. Funções mais aprofundadas vêm na forma de análises que ele pode fornecer sobre seu material de origem – não apenas os fatos, mas a imagem geral que eles pintam. Logo após inserir as fontes, o NotebookLM parece chegar às suas próprias opiniões sobre o que é importante sobre o tópico e pode sugerir perguntas para você fazer e temas para explorar. E embora Woodward diga que o NotebookLM não tem personalidade, ele certamente gosta de falar. Mesmo fazendo uma pergunta simples como o cargo de Johnson, foi apresentada uma lista de quatro pontos.

Como minhas fontes eram três colaboradores do Google e um post do blog da empresa, as saídas do NotebookLM refletiram, sem surpresa, o que o Google deseja que o mundo pense sobre o NotebookLM. Ao fazer perguntas sobre esse material de origem, eu constantemente tive que lembrar o aplicativo que eu não estava escrevendo isso do ponto de vista do Google. Quando pedi para o NotebookLM se descrever da maneira mais simples possível, na esperança de que isso me ajudasse a formular uma breve descrição no primeiro parágrafo deste ensaio, ele respondeu com seus queridos pontos. Pedi para resumir isso em uma única frase que não parecesse uma descrição de RP. Aqui está o que ele me trouxe: “O NotebookLM é uma ferramenta experimental de anotações alimentada por IA que o ajuda a aprender mais rápido, lendo e entendendo seus documentos, gerando resumos, respondendo suas perguntas e até mesmo ajudando a gerar novas ideias.” É um resumo impressionante com base em 10 citações, mas não refletiu o ponto de vista mais importante – o meu. Isso é apropriado, porque cabe a mim fornecê-lo. Também estou feliz que o NotebookLM não tenha tentado impressionar com uma tentativa (patética) de uma linguagem estilizada, porque essa também é minha responsabilidade.

Mas aqui está minha preocupação. Os usuários do NotebookLM que simplesmente querem fazer um bom trabalho rapidamente podem não se dar ao trabalho de pensar com profundidade. Eles podem nem se preocupar em examinar os materiais de pesquisa por si próprios. Por que perder tempo quando seu companheiro de IA examinou o material de forma muito mais minuciosa do que você e já chegou a algumas conclusões interessantes? Johnson não parece tão preocupado com isso como eu. Em primeiro lugar, ele observa que os usuários não têm a obrigação de se envolver em um discurso conceitual com o aplicativo: eles podem usá-lo facilmente para coisas como encontrar aquela passagem onde o cargo de alguém é identificado, entre outras coisas. Mas ele claramente acredita que é uma tremenda vantagem se envolver em um diálogo desse tipo. Ele está entusiasmado que o NotebookLM oferece sugestões de temas para explorar. E você também pode usar um modo em que o NotebookLM pode criticar o seu trabalho e argumentar o lado oposto. “Se estou realmente interessado em chegar a uma perspectiva única, o NotebookLM deve ser capaz de me ajudar nisso com menos trabalho”, diz ele, “e talvez até chegar a uma perspectiva mais interessante”. O que me faz perguntar: De quem seria essa perspectiva agora?

A medida que usamos mais ferramentas de IA, de forma mais intensa, essa pergunta se torna crítica. Depois de passar o ano inteiro de 2023 escrevendo e pensando sobre IA, agora posso resumir minha preocupação chave, de forma mais sucinta do que o NotebookLM pode fazer. Nosso futuro será caracterizado por uma tensão entre co-piloto (IA como colaborador) e piloto automático (humanos como ajudante da IA). Esta última é mais eficiente e mais barata em um sentido restrito de economia de mão de obra, mas problemática em todos os sentidos possíveis.

Ao apontar isso, não estou de maneira alguma menosprezando o NotebookLM. Estou apenas exercitando minha análise de forma que nossos modelos de IA atuais não podem acompanhar (pelo menos por enquanto). Enquanto isso, trabalhando com sua equipe do Google Labs, Steven Johnson alcançou o padrão de ouro para produtos de tecnologia – construindo a ferramenta que ele mais deseja usar pessoalmente. Agora ele pode passar seus dias no Google construindo mais – e talvez sofrer a maldição de conseguir o que pediu.

A paixão de Steven Johnson por ferramentas de suporte ao pensamento começou com o software HyperCard da Apple, que teve uma influência massiva. Em minha coluna na edição de fevereiro de 1988 da Macworld, refleti sobre o HyperCard, tentando avaliar os poderes desse programa fascinante e a ideia de navegar por um mar de informações do mundo – necessariamente através de uma lente pré-internet. Naquela época, eu estava cético de que tal projeto pudesse ser financiado e não antecipava que seria um empreendimento ascendente, acelerado pela Google, uma empresa cuja missão era tornar as informações do mundo universalmente acessíveis. Mas eu estava certo em antecipar as implicações de direitos autorais, com as quais estamos lidando agora na era do ChatGPT.

Há uma longa lista de adeptos dessa visão, começando em 1945 com Vannevar Bush e continuando com Ted Nelson, que cunhou a palavra hipermídia. O presidente da Apple, Sculley, escreve sobre sua crença de que o HyperCard e seus descendentes nos libertarão das “restrições do formato linear de um livro”: vincular informações “do jeito que você pensa” em muitos casos evitará a cansativa convenção de começo, meio e fim. Nossa ficção pode começar a se parecer com romances como Hopscotch, escrito pelo escritor sul-americano Julio Cortazar. O laureado com o Nobel afirmava que os 155 capítulos de seu livro poderiam ser lidos em várias sequências diferentes. No mundo da hipermídia, os livros de não ficção não seriam lidos da frente para trás, mas seriam mesclados em algum Banco Mundial de Informações, cada trecho vinculado de milhões de maneiras a outras informações relevantes. Para citar Sculley, usando esse modelo “permite que o usuário solicite qualquer informação de que ele precise, na dose que ele requer”.

Isso me parece um cenário improvável, pelo menos na escala que alguns comentaristas previram. Uma tarefa enorme está no caminho para realizar o sonho da hipermídia: todo o conhecimento do mundo deve ser inserido como dados e disponibilizado online.

Os problemas de direitos autorais e uso justo também devem ser tratados, o que significa um número quase infinito de horas de advocacia. Num mundo onde muitas pessoas estão famintas e sem-teto, nosso programa espacial está parado, as corporações estão ágeis e enxutas, e cada centavo sobressalente é usado para ferramentas de destruição, é difícil imaginar que este projeto multimilionário seja iniciado algum dia.

Indubitavelmente, formas rápidas de acesso a informações – o que poderia ser conhecido um dia como a tradição HyperCard – mudarão a maneira como fazemos pesquisas e adquirimos conhecimento. Mas quaisquer mudanças num futuro próximo ocorrerão em uma escala muito mais modesta. Enquanto isso, não vamos permitir que falar de superestradas de informação turve nossa visão do que está diante de nós: um programa incrível chamado HyperCard. Está aqui agora, é real, e todos nós temos um trabalho pela frente para descobrir como aproveitar ao máximo.

Já que este será o último texto do ano, e também porque os leitores estão fazendo um trabalho horrível ao encherem minha caixa de entrada com perguntas, vou fazer uma pergunta a mim mesmo. O que você vai cobrir em 2024? Bem, IA, óbvio. Eu quero escrever sobre as descobertas que avançam a tecnologia e a pressa potencialmente perigosa para lançar produtos para se manter um passo à frente da concorrência. Em meus 40 anos cobrindo tecnologia, este é o momento mais emocionante que consigo me lembrar, e também o momento em que um comentário informado é mais crítico.

Também espero ter várias conversas profundas para a nossa série de Grandes Entrevistas, onde algumas pessoas importantes em IA e outras áreas revelam quem são e fazem as perguntas que você mais quer responder.

Em uma das Grandes Entrevistas deste ano, Satya Nadella se referiu à inteligência artificial geral, ou AGI, como potencialmente “a última invenção”. Perdoe meu viés, mas eu não posso aceitar isso. Mesmo que a IA aparentemente ultrapasse o que os humanos podem fazer em todas as áreas, incluindo as criativas, por definição ela nunca poderá fornecer uma coisa que sustenta todos nós e é insubstituível em tudo o que produzimos e criamos. E isso é uma conexão humana. Sim, estou empolgado com a IA. Mas também espero que, mesmo depois de minha partida, pessoas de carne e osso continuem a surpreender e inspirar seus semelhantes com o que criam e conquistam.

Boas festas e nos vemos em janeiro.

Você pode enviar perguntas para [email protected]. Escreva ASK LEVY na linha de assunto.

O resultado mais deprimente das negociações climáticas da COP28 até agora é o recorde número de delegados ligados a empresas de petróleo e gás.

O NotebookLM funcionará em parte com o Gemini LLM do Google, introduzido esta semana. Faz parte de uma grande corrida pelo melhor chatbot.

E aqui está Demis Hassabis, o humano-chefe da Google DeepMind, explicando o que Gemini significa.

No aniversário de 30 anos da ENBLE, convoquei a primeira reunião do “AI Optimist Club”. Acabamos falando não apenas sobre o potencial da IA, mas também sobre seus perigos.

O ex-espião responsável pelo sucesso na TV The Americans tem um novo show ainda mais psicodélico em desenvolvimento.

Não perca as edições futuras exclusivas para assinantes desta coluna. Assine a ENBLE (50% de desconto para os leitores Plaintext) hoje.