O Caso para usar IA para registrar todos os seus momentos vivos

O motivo para utilizar inteligência artificial para registrar todos os seus momentos vividos

As pessoas conhecem Otter.ai como um dos serviços de transcrição movidos por IA que surgiram nos últimos anos, convertendo automaticamente palavras faladas em entrevistas e reuniões em texto. O serviço até mesmo consegue distinguir entre os falantes individuais. Mas seu CEO, Sam Liang, vê essa funcionalidade útil como apenas uma cabeça de praia para um projeto mais abrangente e provocador: Capturar tudo o que você ouve em um conjunto de dados mestre onde você pode pesquisar e reviver cada conversa que já teve.

Texto Simples

INSCREVA-SE para Texto Simples

Liang começou a pensar nisso há uma década, depois de deixar um emprego no Google para cofundar uma startup que monitorava o comportamento das pessoas em dispositivos móveis para fornecer serviços como rastreamento automático de despesas de quilometragem. “Sou obcecado por obter dados e entender dados”, ele confessa. “Na minha primeira startup, usamos muitos sensores do iPhone: localização, GPS, Wi-Fi, movimento. O único sensor que não usamos foi o microfone.” Corrigir isso seria transformador, ele pensou. “Eu estava frustrado porque, com o Gmail, eu podia procurar por algo de 10 anos atrás, mas não havia maneira de procurar por algo que ouvi três horas atrás”, diz ele. “Então fiz um experimento mental. E se eu deixar meu microfone ligado o dia inteiro?” Liang então aumentou ainda mais as apostas. “E se eu fizer ainda melhor – e se eu deixar o microfone ligado o tempo todo, a minha vida inteira – desde o dia em que comecei a falar até o dia em que morrer?” Ele calculou o quanto de dados isso seria e descobriu que você pode armazenar uma vida inteira de áudio em uma unidade USD de 2 terabytes. “Então eu posso procurar por tudo o que ouvi em toda a minha vida”, diz ele. “Meus pais já morreram. Eu realmente gostaria de poder recuperar a voz deles.

Liang não é o único perseguindo o sonho – ou talvez pesadelo – de uma lembrança totalmente controlada pela IA. Como escrevi em fevereiro de 2021, uma startup chamada Rewind já foi lançada com a promessa de captura de vida, e desde então aproveitou os últimos avanços da IA para aumentar essa visão. O fundador Dan Siroker recentemente anunciou um pingente vestível para capturar mais ágilmente tudo que está dentro do alcance eletrônico de uma conversa. E este mês uma nova startup muito anunciada chamada Humane anunciou um substituto para o smartphone na forma de um “pin” que também pode gravar voz.

Esses produtos se juntam a inúmeros dispositivos como Amazon Alexa com microfones sempre prontos, terreno potencialmente fértil para aplicativos que podem gravar passivamente. Talvez o surgimento da IA generativa marque o ponto de inflexão para essa ideia. Usando essa tecnologia, os corpos de gravação podem se tornar conjuntos de dados pelos quais as pessoas podem pesquisar e resumir seus eventos de vida e literalmente dialogar com os detalhes de sua existência. Pode ser como ter seu próprio biógrafo nível Robert Caro à disposição.

Como você pode imaginar, os defensores das liberdades civis têm algumas questões com esse conceito. Jay Stanley, um analista sênior de políticas da União Americana pelas Liberdades Civis, diz que o aumento da captura de áudio constante gera tensões entre a privacidade pessoal e o direito de gravar. Mas ele se preocupa principalmente com o modo como todos esses dados podem ser usados contra as pessoas, mesmo que originalmente pretendidos para aprimorar suas memórias. “A perspectiva levanta questões sobre se os dados serão protegidos, se serão vulneráveis ​​a ataques de hackers e se poderão ser vulneráveis ​​ao acesso do governo”, diz ele. No geral, ele acredita que serviços que gravam todas as suas conversas são uma má ideia. “As pessoas podem sentir que é empoderador ter um registro de tudo o que já ouviram, como uma super memória ou algo assim. Mas isso pode ser desempoderador e acabar se voltando contra você.”

Não surpreendentemente, Liang e Siroker insistem que a privacidade está integrada em seus sistemas. Ambos dizem que desencorajam a gravação de qualquer pessoa sem consentimento. E é claro que eles garantem a segurança de seus sistemas.

Assim como o e-mail agora é fundamental em casos legais, essas gravações inevitavelmente encontrariam seu caminho nos tribunais. Tanto Otter quanto Rewind afirmam que cumpririam intimações oficiais. Liang diz que seria bom ter uma nova legislação que aumentasse o nível do que as autoridades poderiam solicitar em uma investigação. Stanley, da ACLU, diz que isso não seria inédito. “Segundo a lei comum britânica, costumava ser o caso de que, mesmo com um mandado, as autoridades não podiam acessar seu diário ou suas cartas, porque isso era visto como fazer você depor contra si mesmo”. Infelizmente, essa não é a lei atual, mas Liang quer reviver e disseminar o conceito. Ele também acha que devemos eliminar as leis estaduais que exigem consentimento mútuo se uma das partes de uma conversa quiser gravar. “Eu não sou político, mas a lei de escuta é louca”, diz ele. “Cinquenta ou 60 anos atrás, a intenção era boa, mas agora as coisas evoluíram tremendamente com a revolução da IA e o ChatGPT”. Em sua opinião, você não deve poder compartilhar as palavras de outra pessoa sem consentimento, mas se você puder ouvir algo, deveria poder retê-lo. “Todos têm o direito de lembrar”, diz ele.

Uma questão ainda mais complicada é se as pessoas que falam com os serviços de assinatura sempre ativos se sentirão confortáveis com a ideia de ter todas as suas conversas gravadas. As pessoas podem rejeitar essa ideia tão veementemente quanto rejeitaram o Google Glass, indignadas com sua capacidade de gravar vídeos passivamente. “Isso pode ser determinado não no âmbito da lei, mas no âmbito da etiqueta”, diz Stanley. “Eu realmente quero sentar com meu velho amigo da faculdade e passar uma noite em um bar falando sobre tempos antigos quando ele está gravando tudo?”

Se a prática de gravação total em busca de lembrança total se popularizar, será devido à capacidade da IA de fornecer benefícios tangíveis ao explorar um corpora vitalício de conversas – ou mesmo apenas um registro digital do que você esqueceu daquela noite recente na cidade. No momento, a vanguarda desse fenômeno ocorre em reuniões de negócios. Como muitas agora incluem participantes remotos, gravar a sessão é uma escolha de um botão que está sendo cada vez mais invocada. (Liang diz que Otter transcreveu mais de um bilhão de reuniões.) No ambiente de trabalho, pelo menos, a etiqueta está estabelecida. E essas gravações estão se tornando mais úteis. A IA generativa agora oferece uma grande variedade de recursos. Com o Otter, as reuniões podem ser resumidas em tempo real com uma precisão razoável, e os chatbots permitem que os participantes e os atrasados perguntem se uma questão específica foi abordada. Durante uma reunião, você pode perguntar se um tópico já foi discutido anteriormente. E quando a reunião termina, os resultados podem ser despejados em um corpora que é um guia inestimável para as operações de uma empresa.

Para Liang, isso é apenas o começo. Ele me diz que a Otter está trabalhando em um recurso chamado Avatar que permitiria a ele comandar uma reunião sem o incômodo de realmente comparecer. É essencialmente um chatbot construído em torno de anos de dados passados sobre suas contribuições em reuniões. “Muitas vezes tenho duas reuniões marcadas para o mesmo horário, então, para essas reuniões, posso enviar meu avatar, que provavelmente pode responder a 90% das perguntas que me fazem”, diz ele. Pergunto a ele se isso pode ser arriscado – e se o avatar aprovar um plano de negócios que arruine a empresa? “Daríamos a ele apenas um certo nível de autoridade”, diz ele depois de considerar o conceito. “Ei, talvez ele possa aprovar qualquer coisa abaixo de US$ 10.000”. Lembre-me de pedir ao avatar de Liang para me passar um cheque da próxima vez que estivermos na mesma sala Zoom.

Certamente, algumas das características úteis em reuniões de negócios podem ser aplicadas em nossas vidas pessoais. Os chatbots podem responder a perguntas eternas como “O que deu errado no meu casamento?” e oferecer respostas surpreendentemente precisas. Mas será que queremos isso? Em geral, muitas coisas que dizemos podem não parecer boas se fossem gravadas e de alguma forma vazassem para o público. Em um mundo onde tudo é gravado, as pessoas podem se sentir limitadas em se expressar livremente. Siroker acredita que isso não acontecerá, porque a IA será tão boa em imitar a voz de alguém que todos poderão negar plausivelmente qualquer gafe ou declaração criminosa. Isso me parece como a nova versão de negar a responsabilidade por uma postagem tóxica nas redes sociais, alegando que sua conta foi hackeada. Isso não funcionou muito bem para Anthony Weiner.

De forma ideal, o público terá uma discussão ponderada sobre o equilíbrio entre a perda de privacidade ao ter tudo gravado e os benefícios de ter acesso instantâneo à nossa história verbal e aos nossos momentos pessoais mais reproduzíveis. Mas suspeito que não teremos a chance de votar sobre isso. Como tudo o mais que acontece na tecnologia, é mais provável que as empresas ofereçam isso preventivamente. Estar sempre registrado pode ganhar favor ao nos permitir recuperar uma ideia brilhante que tivemos no almoço ou no banho, reproduzir conversas com entes queridos falecidos e resolver disputas sobre quem concordou em lavar a louça. Antes que percebamos, podemos estar viciados. Uma pena – teria sido bom ter essa discussão sobre equilíbrio. E, é claro, gravá-la.

Preocupações especulativas sobre microfones sempre ativados lembram os medos que surgiram quando ficou claro que seria possível rastrear a localização das pessoas em massa. Escrevi sobre isso para a Newsweek em junho de 2004, em uma coluna intitulada “Um Futuro Sem Lugares para se Esconder”. Agora carregamos balizas de localização em nossos bolsos e a Apple opera uma rede global de rastreamento de localização.

A ideia de se livrar de fios e cabos é empolgante: podemos ir a qualquer lugar e manter contato íntimo com nosso trabalho, entes queridos e resultados esportivos em tempo real. Mas essa mesma conexão persistente pode nos levar a um futuro no qual nossos telefones celulares nos marcarão e rastrearão como pacotes da FedEx, às vezes sem estarmos cientes…

Minha suposição é que a adoção generalizada do rastreamento será feita não contra a nossa vontade, mas inicialmente com o nosso consentimento. Assim como outras ferramentas de dois gumes, os benefícios serão imediatamente perceptíveis, enquanto as desvantagens em termos de privacidade surgirão gradualmente. A primeira atração será baseada no medo: além de os empregadores manterem os trabalhadores na linha, mamãe e papai insistirão para que seus adolescentes tenham dispositivos de GPS para poderem segui-los ao longo do dia, algo equivalente ao sistema LoJack para encontrar carros roubados. A segunda etapa ocorrerá conforme serviços baseados em localização, desde navegação até “encontrar amigos” (alguns sistemas informam quando amigos online estão na área), tornarem nossas vidas mais eficientes e prazerosas.

Mais cedo ou mais tarde, porém, perceberemos que informações obtidas com base em nossos movimentos comprometeram nossa “privacidade locacional” – um termo que pode se tornar familiar apenas quando a qualidade que ele se refere for perdida. Se nada for feito, perseguir nosso caso de amor com a tecnologia sem fio resultará na perda de uma liberdade até então não divulgada – a licença para se perder. Aqui está um novo grito de guerra para a era sem fio: Não me coloquem dentro de um “Geo-Fence”.

Erick pergunta: “Qual é a coisa mais entediante (mas valiosa) que a IA pode fazer muito bem?”

Obrigado por perguntar, Erick. Crédito especial por responder ao meu pedido desesperado de última hora no Threads por uma pergunta dos leitores. Pessoal, sei que é divertido perguntar qualquer coisa ao ChatGPT, mas enquanto ainda é possível, aproveitem uma pessoa disposta a fornecer uma resposta para suas perguntas importantes. Então, não hesite em enviar suas perguntas!

Voltando à pergunta: Erick, vamos lá, isso é como perguntar qual é o uso entediante, mas valioso, da eletricidade. A IA está incorporada em tantos produtos e procedimentos hoje em dia que a grande maioria de seus usos, desde correção ortográfica até controle de carga em centros de dados, é bastante entediante. Além disso, todo caso de uso emocionante da IA se torna inevitavelmente entediante quando a tarefa é dominada e implementada. Lembra de como foi emocionante ver a IA jogar xadrez? Agora é apenas uma das coisas que os computadores fazem muito melhor do que nós. A IA é sempre mais interessante quando cientistas e engenheiros ainda não podem fazê-la acontecer. Atualmente, as pessoas estão obcecadas com os fracassos dos veículos autônomos. Toda vez que um carro autônomo se envolve em um acidente – alguns dos quais têm sido trágicos – ou se recusa a sair do caminho de um caminhão de bombeiros, isso é notado e amplificado. Mas sempre que os carros autônomos acertarem completamente, todo o assunto será monótono – apenas mais uma coisa entediante (mas valiosa) que a IA faz muito bem.

Você pode enviar perguntas para [email protected]. Escreva ASK LEVY na linha de assunto.

A cadeia de sanduíches Quiznos pesquisou 2.000 adultos americanos sobre seus pensamentos sobre o apocalipse, fazendo perguntas como se poderiam durar mais do que todos os outros e ser o último humano vivo, com quem gostariam de sobreviver se tivessem um parceiro e, é claro, o que comeriam. “Ao pensar nas consequências de um apocalipse, somos gratos pelos deliciosos sanduíches torrados que estão disponíveis para todos nós agora!” disse o diretor de marketing da empresa. Se eu acreditasse que o apocalipse está iminente, provavelmente pediria algo mais sofisticado.

A incrível história de três hackers adolescentes que quebraram a internet—e acabaram trabalhando para o FBI.

Se um Black Bill Gates surgir, provavelmente você encontraria essa pessoa na Black Blockchain Summit.

Como Taylor Swift e Beyoncé salvaram os cinemas.

Aqui estão os melhores livros de receitas de 2023. Nenhum deles lida com culinária pós-apocalíptica.

O PlainText estará off na próxima semana por causa do Dia de Ação de Graças. Aproveite o feriado e nos vemos em dezembro!